Joyber 发布的文章

使用FFmpeg的多种分割视频的方法按大小分按时长分按场景分

作者: Joyber
时间: 2025-03-29
分类: 默认分类
评论

下面介绍7种使用FFmpeg分割视频的方法。

01 将视频分割成帧

ffmpeg -i video.mp4 thumb%04d.jpg -hide_banner

此命令允许您从视频中提取特定帧，这些帧是组成视频的图像文件。例如视频以每秒24帧的速度运行，则意味着在视频播放时，每秒有24张图像显示在屏幕上。此命令可用于将视频分割为帧并提取单个帧。

02 按大小拆分视频

./split-video.sh huge-video.mov 64000000 "-c:v libx264 -crf 23 -c:a copy -vf scale=960:-1"

在命令中，数字64000000表示64MB，这意味着您的视频将被拆分为每个大小为64MB的块。您可以更改该数字以指定大小。

此命令允许您将较大的视频剪切为特定文件大小的较小视频。当您的视频很大，但只需要特定大小的特定部分用于上传或共享时，这个命令就很有用。其中split-video.sh是依赖于ffmpeg的shell脚本，脚本代码如下：

#!/bin/bash
# Short script to split videos by filesize using ffmpeg by LukeLR

if [ $# -ne 3 ]; then
    echo 'Illegal number of parameters. Needs 3 parameters:'
    echo 'Usage:'
    echo './split-video.sh FILE SIZELIMIT "FFMPEG_ARGS'
    echo 
    echo 'Parameters:'
    echo '    - FILE:        Name of the video file to split'
    echo '    - SIZELIMIT:   Maximum file size of each part (in bytes)'
    echo '    - FFMPEG_ARGS: Additional arguments to pass to each ffmpeg-call'
    echo '                   (video format and quality options etc.)'
    exit 1
fi

FILE="$1"
SIZELIMIT="$2"
FFMPEG_ARGS="$3"

# Duration of the source video
DURATION=$(ffprobe -i "$FILE" -show_entries format=duration -v quiet -of default=noprint_wrappers=1:nokey=1|cut -d. -f1)

# Duration that has been encoded so far
CUR_DURATION=0

# Filename of the source video (without extension)
BASENAME="${FILE%.*}"

# Extension for the video parts
#EXTENSION="${FILE##*.}"
EXTENSION="mp4"

# Number of the current video part
i=1

# Filename of the next video part
NEXTFILENAME="$BASENAME-$i.$EXTENSION"

echo "Duration of source video: $DURATION"

# Until the duration of all partial videos has reached the duration of the source video
while [[ $CUR_DURATION -lt $DURATION ]]; do
    # Encode next part
    echo ffmpeg -i "$FILE" -ss "$CUR_DURATION" -fs "$SIZELIMIT" $FFMPEG_ARGS "$NEXTFILENAME"
    ffmpeg -ss "$CUR_DURATION" -i "$FILE" -fs "$SIZELIMIT" $FFMPEG_ARGS "$NEXTFILENAME"

    # Duration of the new part
    NEW_DURATION=$(ffprobe -i "$NEXTFILENAME" -show_entries format=duration -v quiet -of default=noprint_wrappers=1:nokey=1|cut -d. -f1)

    # Total duration encoded so far
    CUR_DURATION=$((CUR_DURATION + NEW_DURATION))

    i=$((i + 1))

    echo "Duration of $NEXTFILENAME: $NEW_DURATION"
    echo "Part No. $i starts at $CUR_DURATION"

    NEXTFILENAME="$BASENAME-$i.$EXTENSION"
done

03 将视频分割为相等持续时间的部分

ffmpeg -i "input_video.MTS" -ss 164 -f segment -segment_time 120 -vcodec copy -c:a copy -reset_timestamps 1 output_video%d.MTS

#! /bin/bash
#use: ./split.sh ./Captures/di_er_shi_tiao.mp4 0 60 ./diershitiao/video_

ffmpeg -i $1 -ss $2 -f segment -segment_time $3 -vcodec copy -c:a copy -reset_timestamps 1 ${4}%d.mp4

此命令可用于将视频分割为多个持续时间相同的部分。这对于需要或偏好特定视频持续时间的社交媒体网站非常有用。

04 按场景拆分视频

split.sh -d 0.5 -o /tmp/parts -f file.mp4

这个命令检测单个场景并不总是很准确，但可以试试。split.sh 的内容如下：

# Splits video to separate scenes files when full black frames are found in the video
# Inspired by https://gist.github.com/achesco/4dc2ebf13378a0a61fc26c7fe01f539e
# Who got inspired by https://stackoverflow.com/a/38205105

#!/bin/bash

file=""
out="./"
dur=0.05
stripaudio=""
ratio=1.00
th=0.05
add=0.00
trim=0.00

usage () {
  echo "Usage: $(basename $0) [[[-o folder] [-d black duration]] | [-h]] -f file.mp4"
  echo
  echo "Options:"
  echo "-f, --file          Input file"
  echo "-o, --out           Outpup files folder path, default"
  echo "                    to current folder"
  echo "-d, --dur           Duration for black detection in seconds. 0.05 default (practical single frame)"
  echo "-r, --ratio        ffmpeg pic_th : Set the threshold for considering a picture black. 1.00 default"
  echo "-th, --threshold   ffmpeg pix_th : Set the threshold for considering a pixel black. 0.00 default."
  echo "-t, --trim          Substracts to splitting timestamp in seconds. 0 default"
  echo "-a, --add           Adds to splitting timestamp in seconds. 0 default"
  echo "-sa, --strip-audio  Strip audio"
  echo "-h, --help          Display this help message"
  echo
  echo "Example: split.sh -d 0.5 -o /tmp/parts -f file.mp4"
  echo "Splits file.mp4 file to scenes with black frames during more than 0.5 second"
  echo "and saves output parts to /tmp/parts folder"
}

if [ "$1" = "" ]; then
  usage
fi

while [ "$1" != "" ]; do
  case $1 in
    -f | --file )
      shift
      file=$1
      ;;
    -d | --dur )
      shift
      dur=$1
      ;;
    -r | --ratio )
      shift
      ratio=$1
      ;;
    -th | --threshold )
      shift
      th=$1
      ;;
    -o | --out )
      shift
      out=$1
      ;;
    -t | --trim )
      shift
      trim=$1
      ;;
    -a | --add )
      shift
      add=$1
      ;;
    -sa | --strip-audio )
      stripaudio="-an"
      ;;
    -h | --help )
      usage
      exit
      ;;
    * )
      usage
      exit 1
  esac
  shift
done

cut_part () {
  duration_flag=""
  if [[ "$3" != "" ]]; then
    duration_flag="-t"
  fi
  echo "cutting from $1 during $3"
  printf -v fileout "$out/%04d_%s" $2 $filename
  ffmpeg -y -loglevel error -hide_banner -i $file -ss $1 $stripaudio $duration_flag $3 $fileout < /dev/null
}

filename=`basename $file`
mkdir -p $out
timefrom=0
i=1

ffmpeg -i $file -vf blackdetect=d=$dur:pic_th=$ratio:pix_th=$th -f null - 2> ffout
black_start=( $(grep blackdetect ffout | grep black_start:[0-9.]* -o | grep "[0-9]*(\.[0-9]*)?" -oE) )
black_duration=( $(grep blackdetect ffout | grep black_duration:[0-9.]* -o | grep "[0-9]*(\.[0-9]*)?" -oE) )
> timestamps
for ii in "${!black_start[@]}"; do
  half=$(bc -l <<< "${black_duration[$ii]}/2")
  middletime=$(bc -l <<< "${black_start[$ii]} + $half")
  echo $middletime | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}' >> timestamps
  echo "" >> timestamps
done

while read -r timestamp; do
  duration=`bc -l <<< "$timestamp-$timefrom+$add-$trim" | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}'`
  cut_part $timefrom $i $duration
  timefrom=`bc -l <<< "$timestamp+$add-$trim" | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}'`
  i=`expr $i + 1`
done < timestamps

if [[ "$timefrom" != 0 ]]; then
  cut_part $timefrom $i
fi

另外还有一个python 替代方案——scenedetect。

#安装场景检测所需模块

pip install scenedetect[opencv] -i https://pypi.tuna.tsinghua.edu.cn/simple

#检验是否已安装场景检测所需模块
pip list

click 
colorama
numpy 
opencv-python
scenedetect   0.5.5
tqdm

使用方式

scenedetect --input my_video.mp4 --output my_video_scenes --stats my_video.stats.csv 
time --start 00:05:00 --end 00:06:00 \
detect-content #对输入视频执行内容检测算法
list-scenes # 打印场景列表并输出到CSV文件
split-video # 使用ffmpeg或mkvMerge分割输入视频

测试

scenedetect --input /Users/zgq/Downloads/video.mp4 --output /Users/zgq/Downloads/my_video_scenes time --start 00:00:00 --end 00:01:00 detect-content split-video

05 按时间或持续时间分割视频

ffmpeg -ss 00:00:00 -t 00:50:00 -i largefile.mp4 -acodec copy \-vcodec copy smallfile.mp4

上面的命令将视频从开始的50分钟分割。你也可以随意改变参数。只需重复该过程，就可以把剩余部分的视频得分割成多个部分。

06 按宽度分割视频

ffmpeg -i input.mp4 -filter:v "crop=iw*(5/10):ih*(5/10):iw:0" output.mp4

在上面的例子中，视频将被裁剪为原高度和宽度的一半。要保持相同的高度，只需将ih组件的参数更改为10/10。您还可以通过在上面示例中的引号内使用：keep_aspect=1参数来保持长宽比。命令如下：

ffmpeg -i input.mp4 -filter:v "crop=iw*(5/10):ih*(5/10):iw:0:keep_aspect=1" output.mp4

07 FFmpeg水平分割视频

这本质上和上一个是相同的裁剪功能，但不是将其裁剪为更小的宽度，而是保持宽度不变，并将视频的高度降低50%。以下两个命令，一个是不带高宽比例，一个带高宽比例：
``
ffmpeg -i input.mp4 -filter:v "crop=iw(5/10):ih(5/10):iw:0" output.mp4

ffmpeg -i input.mp4 -filter:v "crop=iw(5/10):ih(5/10):iw:0:keep_aspect=1" output.mp4

正则表达式中：?=、?<=、?!、?<! 的用法详细说明

作者: Joyber
时间: 2025-03-28
分类: 默认分类
评论

在正则表达式中，?=, ?<=, ?!, 和 ?<! 是 零宽度断言（lookaround assertions）的一部分。它们用于在匹配过程中进行某种条件判断，但并不会消耗字符（即不包括在最终的匹配结果中）。下面我将详细介绍它们的用法：

1. `?=`: 正向前瞻（Positive Lookahead）

正向前瞻 ?= 用于匹配某个位置，要求其后面跟着某个模式，但不会包含该模式。

语法：X(?=Y)
- 这个模式会匹配字符 X，但只有在字符 X 后面跟着 Y 时才会匹配。
- Y 不会被包含在匹配结果中。
示例：

$pattern = '/\d(?=\D)/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中，(?=\D) 是一个正向前瞻，它检查数字后面是否跟着非数字字符。最终匹配的结果是数字 3，因为它后面是字母 a，符合条件。

2. `?<=`: 反向前瞻（Positive Lookbehind）

反向前瞻 ?<= 用于匹配某个位置，要求其前面是某个模式，但不会包含该模式。

语法：(?<=Y)X
- 这个模式会匹配字符 X，但只有在字符 X 前面是 Y 时才会匹配。
- Y 不会被包含在匹配结果中。
示例：

$pattern = '/(?<=\d)a/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中，(?<=\d) 是一个反向前瞻，它检查字母 a 前面是否是数字。最终匹配的结果是字母 a，因为它前面是数字 3，符合条件。

3. `?!`: 负向前瞻（Negative Lookahead）

负向前瞻 ?! 用于匹配某个位置，要求其后面不跟着某个模式。

语法：X(?!Y)
- 这个模式会匹配字符 X，但只有在字符 X 后面不跟着 Y 时才会匹配。
- Y 不会被包含在匹配结果中。
示例：

$pattern = '/\d(?!\d)/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中，(?!\d) 是一个负向前瞻，它检查数字后面是否不跟着另一个数字。最终匹配的结果是数字 3，因为它后面跟着字母 a，不符合 \d（数字）模式。

4. `?<!`: 负向反向前瞻（Negative Lookbehind）

负向反向前瞻 ?<! 用于匹配某个位置，要求其前面不是某个模式。

语法：(?<!Y)X
- 这个模式会匹配字符 X，但只有在字符 X 前面不是 Y 时才会匹配。
- Y 不会被包含在匹配结果中。
示例：

$pattern = '/(?<!\d)a/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中，(?<!\d) 是一个负向反向前瞻，它检查字母 a 前面是否不是数字。最终匹配的结果是字母 a，因为它前面是字母 3，符合条件。

总结

断言	描述	示例	匹配内容
`?=`	正向前瞻：匹配后面跟着某个模式的位置	`\d(?=\D)`	数字后跟非数字
`?<=`	反向前瞻：匹配前面是某个模式的位置	`(?<=\d)a`	数字后面的字母 `a`
`?!`	负向前瞻：匹配后面不跟某个模式的位置	`\d(?!\d)`	单个数字后不是数字
`?<!`	负向反向前瞻：匹配前面不跟某个模式的位置	`(?<!\d)a`	非数字前面的字母 `a`

这些零宽度断言非常有用，可以在不影响匹配的内容的情况下，进行更灵活的条件判断，帮助你精确控制正则匹配的范围。

服装商城分类

作者: Joyber
时间: 2025-03-27
分类: 默认分类
评论

好的，为了进一步完善和细化这两层分类，我们可以在每个服装类型下加入一些更具体的子分类，让顾客在选择时能更精确地找到需要的商品，同时保持分类清晰和简单。

以下是改进后的性别 + 服装类型的两层分类设计，并且加入了更多细化项：

1. 一级分类: 性别

男装
女装
儿童装

2. 二级分类: 服装类型

男装

外套
- 大衣
- 风衣
- 羽绒服
- 夹克
- 棉服
- 牛仔外套
- 西装外套
上衣
- T恤
- 衬衫
- 毛衣/针织衫
- Polo衫
- 背心
- 卫衣
- 运动衫
裤子
- 牛仔裤
- 休闲裤
- 西裤
- 运动裤
- 紧身裤
- 打底裤
配饰
- 围巾/披肩
- 帽子
- 手套
- 领带/领结
- 腰带
- 袜子
- 袜子/丝袜
鞋类
- 运动鞋
- 正装鞋
- 凉鞋/拖鞋
- 靴子
- 高帮鞋
- 平底鞋

女装

外套
- 大衣
- 风衣
- 羽绒服
- 夹克
- 棉服
- 牛仔外套
- 西装外套
上衣
- T恤
- 衬衫
- 毛衣/针织衫
- Polo衫
- 背心
- 卫衣
- 运动衫
裙子
- 连衣裙
- 半身裙
- 长裙
- 短裙
- A字裙
- 包臀裙
配饰
- 围巾/披肩
- 帽子
- 手套
- 领带/领结
- 腰带
- 袜子/丝袜
- 珠宝/首饰
- 手袋/钱包
鞋类
- 运动鞋
- 正装鞋
- 凉鞋/拖鞋
- 靴子
- 高跟鞋
- 平底鞋

儿童装

男童装
- 外套
- 上衣
- 裤子
- 配饰
- 鞋类
女童装
- 外套
- 上衣
- 裙子
- 配饰
- 鞋类
婴儿装
- 外套
- 上衣
- 裤子
- 配饰
- 鞋类

总结：

在这个两层分类结构下，我们为每个服装类型增加了更细的子类别，以确保顾客能够根据具体需求进一步筛选：

外套：细化了大衣、风衣、羽绒服、夹克、棉服等类型，以便顾客能够快速选择自己需要的款式。
上衣：加入了T恤、衬衫、毛衣、Polo衫等多个子类，进一步细化了选择。
裤子：细分为牛仔裤、休闲裤、运动裤等不同款式，让顾客根据实际需求做出选择。
裙子：仅限女装，细化了连衣裙、半身裙、A字裙等款式，满足不同风格和场合的需求。
配饰：配饰类目进一步拓展，包括围巾、手袋、珠宝等多样商品。
鞋类：增加了高帮鞋、平底鞋等细分款式，便于顾客挑选。

优点：

清晰简洁：保留了两层分类的简洁性，让顾客不至于迷失在太多的细节中。
便于快速选择：每个分类都覆盖到常见和流行的服装款式，用户可以直接通过服装类型进入相应的子类，节省时间。
全面覆盖：即使是用户有具体需求的情况，比如选择羽绒服或A字裙，也能通过细化的分类迅速找到。

适用场景：

商品种类适中：商城中商品种类丰富，但依然可以通过两层分类清晰展示。
主打简洁与流畅：对于那些不希望过多复杂筛选，但又需要一定细化选择的顾客，两层分类非常适用。

如果商城服装种类不断增多，可以根据实际情况考虑加入筛选功能（如品牌、材质、价格等）来进一步帮助顾客精准选择。

php+nginx上传图片请求返回413或502错误怎么排查

作者: Joyber
时间: 2025-03-26
分类: 默认分类
评论

在上传文件的时候，可能会超时而返回413、502等错误状态

返回413：内容太长了 nginx配置
检查nginx配置是否配置了 client_max_body_size 值，如没有配置的话默认是1m；在nginx中设置此配置项即可：
https://nginx.org/en/docs/http/ngx_http_core_module.html#client_max_body_size

Syntax:    client_max_body_size size;
Default:    
client_max_body_size 1m;
Context:    http, server, location

返回502，PHP执行超时
可能是由于处理超时了，检查php.ini, php-fpm.ini配置
https://www.php.net/manual/zh/info.configuration.php#ini.max-execution-time

php-fpm: request_terminate_timeout
php.ini: max_execution_time   默认30秒

php正则表达式匹配指定长度的数字，前后无连续多余数字，匹配手机号微信QQ

作者: Joyber
时间: 2025-03-25
分类: 默认分类
评论

在 PHP 中，使用正则表达式提取一串符合条件的数字（连续的6到11位数字），可以按照以下步骤构建正则表达式。

目标是：

匹配连续的6到11位数字。
目标数字前后不能有其他数字。

可以使用以下正则表达式：

(?<!\d)\d{6,11}(?!\d)

解释：

(?<!\d)：负向前瞻，确保目标数字前面没有其他数字（即，前面不是一个数字）。
\d{6,11}：匹配连续6到11位数字。
(?!\d)：负向后瞻，确保目标数字后面没有其他数字（即，后面不是一个数字）。

示例 PHP 代码

<?php
$input = "654654658";  // 目标输入

// 正则表达式
$pattern = '/(?<!\d)\d{6,11}(?!\d)/';

// 查找匹配项
if (preg_match($pattern, $input, $matches)) {
    echo "匹配到的数字是: " . $matches[0];
} else {
    echo "没有匹配到符合条件的数字";
}
?>

说明：

preg_match 函数用于匹配目标字符串中的数字。
如果匹配成功，会输出符合条件的数字，否则会输出“没有匹配到符合条件的数字”。

示例：

输入 654654658 会输出 654654658。
输入 6546596154984654656746 会输出 "没有匹配到符合条件的数字"，因为这个字符串中的数字连续过长，超过了 11 位。

实际应用：匹配出字符串中的电话和微信、QQ

    /**
     * 匹配出字符串中的电话和微信
     * @param $content
     * @return string[] [电话，微信，QQ号]
     */
    public static function matchPhoneWeixin($content)
    {
        // 国内手机号(13568568454)
        $regPhone = '#(?<!\d)(1[3-9][\d]{9})(?!\d).*#'; //不能是电话后面还带数字的情况
        // 国际手机号(+8613568568454 +0086 13568568454)
        $regPhone2 = '#(\+\d{2,5}\s?[\d]{8,11})(?!\d).*#';
        // 微信号(必须以字母或者下划线开头，字母不区分大小写；可使用6-20个字母、数字、下划线和减号或它们的组合； 不支持设置中文)
        $regWeixin = '#([a-zA-Z_][a-zA-Z0-9_\-]{5,20})#';
        // QQ号（要求6-11位）
        $regQQ = '#(?<!\d)([1-9]\d{5,10})(?!\d).*#';
        $phone     = '';
        $weixin    = '';
        $qq        = '';
        $content   = preg_replace('/[\s]+/', '', $content); //去除空格
        if (preg_match($regPhone, $content, $match)) $phone = $match[1];
        if (preg_match($regPhone2, $content, $match)) $phone = $match[1];
        if (preg_match($regWeixin, $content, $match)) $weixin = $match[1];
        if (!$phone && !$weixin && preg_match($regQQ, $content, $match)) {
            if (
                mb_strpos($content, '微信') !== false ||
                mb_strpos($content, '+v') !== false ||
                mb_strpos($content, '+V') !== false ||
                mb_strpos($content, '加v') !== false ||
                mb_strpos($content, '加V') !== false ||
                mb_strpos($content, 'WX') !== false ||
                mb_strpos($content, 'vx') !== false ||
                mb_strpos($content, 'v') !== false ||
                mb_strpos($content, 'V') !== false
            ) {
                //这串数字识别为微信
                $weixin = $match[1];
            } else {
                //20241231，不用匹配为QQ号，容易误抓
                //20250303张老师：启用QQ号匹配，优化一下最大长度11位，提升正确率
                $qq = $match[1];
            }
        }
        return [$phone, $weixin, $qq];
    }