Joyber 发布的文章

下面介绍7种使用FFmpeg分割视频的方法。

01 将视频分割成帧

ffmpeg -i video.mp4 thumb%04d.jpg -hide_banner

此命令允许您从视频中提取特定帧,这些帧是组成视频的图像文件。例如视频以每秒24帧的速度运行,则意味着在视频播放时,每秒有24张图像显示在屏幕上。此命令可用于将视频分割为帧并提取单个帧。

02 按大小拆分视频

./split-video.sh huge-video.mov 64000000 "-c:v libx264 -crf 23 -c:a copy -vf scale=960:-1"

在命令中,数字64000000表示64MB,这意味着您的视频将被拆分为每个大小为64MB的块。您可以更改该数字以指定大小。

此命令允许您将较大的视频剪切为特定文件大小的较小视频。当您的视频很大,但只需要特定大小的特定部分用于上传或共享时,这个命令就很有用。其中split-video.sh是依赖于ffmpeg的shell脚本,脚本代码如下:

#!/bin/bash
# Short script to split videos by filesize using ffmpeg by LukeLR

if [ $# -ne 3 ]; then
    echo 'Illegal number of parameters. Needs 3 parameters:'
    echo 'Usage:'
    echo './split-video.sh FILE SIZELIMIT "FFMPEG_ARGS'
    echo 
    echo 'Parameters:'
    echo '    - FILE:        Name of the video file to split'
    echo '    - SIZELIMIT:   Maximum file size of each part (in bytes)'
    echo '    - FFMPEG_ARGS: Additional arguments to pass to each ffmpeg-call'
    echo '                   (video format and quality options etc.)'
    exit 1
fi

FILE="$1"
SIZELIMIT="$2"
FFMPEG_ARGS="$3"

# Duration of the source video
DURATION=$(ffprobe -i "$FILE" -show_entries format=duration -v quiet -of default=noprint_wrappers=1:nokey=1|cut -d. -f1)

# Duration that has been encoded so far
CUR_DURATION=0

# Filename of the source video (without extension)
BASENAME="${FILE%.*}"

# Extension for the video parts
#EXTENSION="${FILE##*.}"
EXTENSION="mp4"

# Number of the current video part
i=1

# Filename of the next video part
NEXTFILENAME="$BASENAME-$i.$EXTENSION"

echo "Duration of source video: $DURATION"

# Until the duration of all partial videos has reached the duration of the source video
while [[ $CUR_DURATION -lt $DURATION ]]; do
    # Encode next part
    echo ffmpeg -i "$FILE" -ss "$CUR_DURATION" -fs "$SIZELIMIT" $FFMPEG_ARGS "$NEXTFILENAME"
    ffmpeg -ss "$CUR_DURATION" -i "$FILE" -fs "$SIZELIMIT" $FFMPEG_ARGS "$NEXTFILENAME"

    # Duration of the new part
    NEW_DURATION=$(ffprobe -i "$NEXTFILENAME" -show_entries format=duration -v quiet -of default=noprint_wrappers=1:nokey=1|cut -d. -f1)

    # Total duration encoded so far
    CUR_DURATION=$((CUR_DURATION + NEW_DURATION))

    i=$((i + 1))

    echo "Duration of $NEXTFILENAME: $NEW_DURATION"
    echo "Part No. $i starts at $CUR_DURATION"

    NEXTFILENAME="$BASENAME-$i.$EXTENSION"
done

03 将视频分割为相等持续时间的部分

ffmpeg -i "input_video.MTS" -ss 164 -f segment -segment_time 120 -vcodec copy -c:a copy -reset_timestamps 1 output_video%d.MTS
#! /bin/bash
#use: ./split.sh ./Captures/di_er_shi_tiao.mp4 0 60 ./diershitiao/video_

ffmpeg -i $1 -ss $2 -f segment -segment_time $3 -vcodec copy -c:a copy -reset_timestamps 1 ${4}%d.mp4

此命令可用于将视频分割为多个持续时间相同的部分。这对于需要或偏好特定视频持续时间的社交媒体网站非常有用。

04 按场景拆分视频

split.sh -d 0.5 -o /tmp/parts -f file.mp4

这个命令检测单个场景并不总是很准确,但可以试试。split.sh 的内容如下:

# Splits video to separate scenes files when full black frames are found in the video
# Inspired by https://gist.github.com/achesco/4dc2ebf13378a0a61fc26c7fe01f539e
# Who got inspired by https://stackoverflow.com/a/38205105

#!/bin/bash

file=""
out="./"
dur=0.05
stripaudio=""
ratio=1.00
th=0.05
add=0.00
trim=0.00

usage () {
  echo "Usage: $(basename $0) [[[-o folder] [-d black duration]] | [-h]] -f file.mp4"
  echo
  echo "Options:"
  echo "-f, --file          Input file"
  echo "-o, --out           Outpup files folder path, default"
  echo "                    to current folder"
  echo "-d, --dur           Duration for black detection in seconds. 0.05 default (practical single frame)"
  echo "-r, --ratio        ffmpeg pic_th : Set the threshold for considering a picture black. 1.00 default"
  echo "-th, --threshold   ffmpeg pix_th : Set the threshold for considering a pixel black. 0.00 default."
  echo "-t, --trim          Substracts to splitting timestamp in seconds. 0 default"
  echo "-a, --add           Adds to splitting timestamp in seconds. 0 default"
  echo "-sa, --strip-audio  Strip audio"
  echo "-h, --help          Display this help message"
  echo
  echo "Example: split.sh -d 0.5 -o /tmp/parts -f file.mp4"
  echo "Splits file.mp4 file to scenes with black frames during more than 0.5 second"
  echo "and saves output parts to /tmp/parts folder"
}

if [ "$1" = "" ]; then
  usage
fi

while [ "$1" != "" ]; do
  case $1 in
    -f | --file )
      shift
      file=$1
      ;;
    -d | --dur )
      shift
      dur=$1
      ;;
    -r | --ratio )
      shift
      ratio=$1
      ;;
    -th | --threshold )
      shift
      th=$1
      ;;
    -o | --out )
      shift
      out=$1
      ;;
    -t | --trim )
      shift
      trim=$1
      ;;
    -a | --add )
      shift
      add=$1
      ;;
    -sa | --strip-audio )
      stripaudio="-an"
      ;;
    -h | --help )
      usage
      exit
      ;;
    * )
      usage
      exit 1
  esac
  shift
done

cut_part () {
  duration_flag=""
  if [[ "$3" != "" ]]; then
    duration_flag="-t"
  fi
  echo "cutting from $1 during $3"
  printf -v fileout "$out/%04d_%s" $2 $filename
  ffmpeg -y -loglevel error -hide_banner -i $file -ss $1 $stripaudio $duration_flag $3 $fileout < /dev/null
}

filename=`basename $file`
mkdir -p $out
timefrom=0
i=1

ffmpeg -i $file -vf blackdetect=d=$dur:pic_th=$ratio:pix_th=$th -f null - 2> ffout
black_start=( $(grep blackdetect ffout | grep black_start:[0-9.]* -o | grep "[0-9]*(\.[0-9]*)?" -oE) )
black_duration=( $(grep blackdetect ffout | grep black_duration:[0-9.]* -o | grep "[0-9]*(\.[0-9]*)?" -oE) )
> timestamps
for ii in "${!black_start[@]}"; do
  half=$(bc -l <<< "${black_duration[$ii]}/2")
  middletime=$(bc -l <<< "${black_start[$ii]} + $half")
  echo $middletime | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}' >> timestamps
  echo "" >> timestamps
done

while read -r timestamp; do
  duration=`bc -l <<< "$timestamp-$timefrom+$add-$trim" | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}'`
  cut_part $timefrom $i $duration
  timefrom=`bc -l <<< "$timestamp+$add-$trim" | LC_ALL=en_US.UTF-8 awk '{printf "%f", $0}'`
  i=`expr $i + 1`
done < timestamps

if [[ "$timefrom" != 0 ]]; then
  cut_part $timefrom $i
fi

另外还有一个python 替代方案——scenedetect。

#安装场景检测所需模块

pip install scenedetect[opencv] -i https://pypi.tuna.tsinghua.edu.cn/simple

#检验是否已安装场景检测所需模块
pip list

click 
colorama
numpy 
opencv-python
scenedetect   0.5.5
tqdm

使用方式

scenedetect --input my_video.mp4 --output my_video_scenes --stats my_video.stats.csv 
time --start 00:05:00 --end 00:06:00 \
detect-content #对输入视频执行内容检测算法
list-scenes # 打印场景列表并输出到CSV文件
split-video # 使用ffmpeg或mkvMerge分割输入视频

测试

scenedetect --input /Users/zgq/Downloads/video.mp4 --output /Users/zgq/Downloads/my_video_scenes time --start 00:00:00 --end 00:01:00 detect-content split-video

05 按时间或持续时间分割视频

ffmpeg -ss 00:00:00 -t 00:50:00 -i largefile.mp4 -acodec copy \-vcodec copy smallfile.mp4

上面的命令将视频从开始的50分钟分割。你也可以随意改变参数。只需重复该过程,就可以把剩余部分的视频得分割成多个部分。

06 按宽度分割视频

ffmpeg -i input.mp4 -filter:v "crop=iw*(5/10):ih*(5/10):iw:0" output.mp4

在上面的例子中,视频将被裁剪为原高度和宽度的一半。要保持相同的高度,只需将ih组件的参数更改为10/10。您还可以通过在上面示例中的引号内使用:keep_aspect=1参数来保持长宽比。命令如下:

ffmpeg -i input.mp4 -filter:v "crop=iw*(5/10):ih*(5/10):iw:0:keep_aspect=1" output.mp4

07 FFmpeg水平分割视频

这本质上和上一个是相同的裁剪功能,但不是将其裁剪为更小的宽度,而是保持宽度不变,并将视频的高度降低50%。以下两个命令,一个是不带高宽比例,一个带高宽比例:
``
ffmpeg -i input.mp4 -filter:v "crop=iw(5/10):ih(5/10):iw:0" output.mp4

ffmpeg -i input.mp4 -filter:v "crop=iw(5/10):ih(5/10):iw:0:keep_aspect=1" output.mp4

在正则表达式中,?=, ?<=, ?!, 和 ?<!零宽度断言(lookaround assertions)的一部分。它们用于在匹配过程中进行某种条件判断,但并不会消耗字符(即不包括在最终的匹配结果中)。下面我将详细介绍它们的用法:

1. ?=: 正向前瞻(Positive Lookahead)

正向前瞻 ?= 用于匹配某个位置,要求其后面跟着某个模式,但不会包含该模式。

  • 语法X(?=Y)

    • 这个模式会匹配字符 X,但只有在字符 X 后面跟着 Y 时才会匹配。
    • Y 不会被包含在匹配结果中。
  • 示例
$pattern = '/\d(?=\D)/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中,(?=\D) 是一个正向前瞻,它检查数字后面是否跟着非数字字符。最终匹配的结果是数字 3,因为它后面是字母 a,符合条件。

2. ?<=: 反向前瞻(Positive Lookbehind)

反向前瞻 ?<= 用于匹配某个位置,要求其前面是某个模式,但不会包含该模式。

  • 语法(?<=Y)X

    • 这个模式会匹配字符 X,但只有在字符 X 前面是 Y 时才会匹配。
    • Y 不会被包含在匹配结果中。
  • 示例
$pattern = '/(?<=\d)a/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中,(?<=\d) 是一个反向前瞻,它检查字母 a 前面是否是数字。最终匹配的结果是字母 a,因为它前面是数字 3,符合条件。

3. ?!: 负向前瞻(Negative Lookahead)

负向前瞻 ?! 用于匹配某个位置,要求其后面跟着某个模式。

  • 语法X(?!Y)

    • 这个模式会匹配字符 X,但只有在字符 X 后面跟着 Y 时才会匹配。
    • Y 不会被包含在匹配结果中。
  • 示例
$pattern = '/\d(?!\d)/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中,(?!\d) 是一个负向前瞻,它检查数字后面是否跟着另一个数字。最终匹配的结果是数字 3,因为它后面跟着字母 a,不符合 \d(数字)模式。

4. ?<!: 负向反向前瞻(Negative Lookbehind)

负向反向前瞻 ?<! 用于匹配某个位置,要求其前面是某个模式。

  • 语法(?<!Y)X

    • 这个模式会匹配字符 X,但只有在字符 X 前面Y 时才会匹配。
    • Y 不会被包含在匹配结果中。
  • 示例
$pattern = '/(?<!\d)a/';
$string = "123a456";
preg_match($pattern, $string, $matches);
print_r($matches);

在这个例子中,(?<!\d) 是一个负向反向前瞻,它检查字母 a 前面是否是数字。最终匹配的结果是字母 a,因为它前面是字母 3,符合条件。


总结

断言描述示例匹配内容
?=正向前瞻:匹配后面跟着某个模式的位置\d(?=\D)数字后跟非数字
?<=反向前瞻:匹配前面是某个模式的位置(?<=\d)a数字后面的字母 a
?!负向前瞻:匹配后面不跟某个模式的位置\d(?!\d)单个数字后不是数字
?<!负向反向前瞻:匹配前面不跟某个模式的位置(?<!\d)a非数字前面的字母 a

这些零宽度断言非常有用,可以在不影响匹配的内容的情况下,进行更灵活的条件判断,帮助你精确控制正则匹配的范围。

好的,为了进一步完善和细化这两层分类,我们可以在每个服装类型下加入一些更具体的子分类,让顾客在选择时能更精确地找到需要的商品,同时保持分类清晰和简单。

以下是改进后的性别 + 服装类型两层分类设计,并且加入了更多细化项:


1. 一级分类: 性别

  • 男装
  • 女装
  • 儿童装

2. 二级分类: 服装类型

男装

  • 外套

    • 大衣
    • 风衣
    • 羽绒服
    • 夹克
    • 棉服
    • 牛仔外套
    • 西装外套
  • 上衣

    • T恤
    • 衬衫
    • 毛衣/针织衫
    • Polo衫
    • 背心
    • 卫衣
    • 运动衫
  • 裤子

    • 牛仔裤
    • 休闲裤
    • 西裤
    • 运动裤
    • 紧身裤
    • 打底裤
  • 配饰

    • 围巾/披肩
    • 帽子
    • 手套
    • 领带/领结
    • 腰带
    • 袜子
    • 袜子/丝袜
  • 鞋类

    • 运动鞋
    • 正装鞋
    • 凉鞋/拖鞋
    • 靴子
    • 高帮鞋
    • 平底鞋

女装

  • 外套

    • 大衣
    • 风衣
    • 羽绒服
    • 夹克
    • 棉服
    • 牛仔外套
    • 西装外套
  • 上衣

    • T恤
    • 衬衫
    • 毛衣/针织衫
    • Polo衫
    • 背心
    • 卫衣
    • 运动衫
  • 裙子

    • 连衣裙
    • 半身裙
    • 长裙
    • 短裙
    • A字裙
    • 包臀裙
  • 配饰

    • 围巾/披肩
    • 帽子
    • 手套
    • 领带/领结
    • 腰带
    • 袜子/丝袜
    • 珠宝/首饰
    • 手袋/钱包
  • 鞋类

    • 运动鞋
    • 正装鞋
    • 凉鞋/拖鞋
    • 靴子
    • 高跟鞋
    • 平底鞋

儿童装

  • 男童装

    • 外套
    • 上衣
    • 裤子
    • 配饰
    • 鞋类
  • 女童装

    • 外套
    • 上衣
    • 裙子
    • 配饰
    • 鞋类
  • 婴儿装

    • 外套
    • 上衣
    • 裤子
    • 配饰
    • 鞋类

总结

在这个两层分类结构下,我们为每个服装类型增加了更细的子类别,以确保顾客能够根据具体需求进一步筛选:

  • 外套:细化了大衣、风衣、羽绒服、夹克、棉服等类型,以便顾客能够快速选择自己需要的款式。
  • 上衣:加入了T恤、衬衫、毛衣、Polo衫等多个子类,进一步细化了选择。
  • 裤子:细分为牛仔裤、休闲裤、运动裤等不同款式,让顾客根据实际需求做出选择。
  • 裙子:仅限女装,细化了连衣裙、半身裙、A字裙等款式,满足不同风格和场合的需求。
  • 配饰:配饰类目进一步拓展,包括围巾、手袋、珠宝等多样商品。
  • 鞋类:增加了高帮鞋、平底鞋等细分款式,便于顾客挑选。

优点:

  1. 清晰简洁:保留了两层分类的简洁性,让顾客不至于迷失在太多的细节中。
  2. 便于快速选择:每个分类都覆盖到常见和流行的服装款式,用户可以直接通过服装类型进入相应的子类,节省时间。
  3. 全面覆盖:即使是用户有具体需求的情况,比如选择羽绒服或A字裙,也能通过细化的分类迅速找到。

适用场景:

  • 商品种类适中:商城中商品种类丰富,但依然可以通过两层分类清晰展示。
  • 主打简洁与流畅:对于那些不希望过多复杂筛选,但又需要一定细化选择的顾客,两层分类非常适用。

如果商城服装种类不断增多,可以根据实际情况考虑加入筛选功能(如品牌、材质、价格等)来进一步帮助顾客精准选择。

在上传文件的时候,可能会超时而返回413、502等错误状态

返回413:内容太长了 nginx配置
检查nginx配置是否配置了 client_max_body_size 值 ,如没有配置的话默认是1m;在nginx中设置此配置项即可:
https://nginx.org/en/docs/http/ngx_http_core_module.html#client_max_body_size

Syntax:    client_max_body_size size;
Default:    
client_max_body_size 1m;
Context:    http, server, location

返回502,PHP执行超时
可能是由于处理超时了,检查php.ini, php-fpm.ini配置
https://www.php.net/manual/zh/info.configuration.php#ini.max-execution-time

php-fpm: request_terminate_timeout
php.ini: max_execution_time   默认30秒

在 PHP 中,使用正则表达式提取一串符合条件的数字(连续的6到11位数字),可以按照以下步骤构建正则表达式。

目标是:

  1. 匹配连续的6到11位数字。
  2. 目标数字前后不能有其他数字。

可以使用以下正则表达式:

(?<!\d)\d{6,11}(?!\d)

解释:

  • (?<!\d):负向前瞻,确保目标数字前面没有其他数字(即,前面不是一个数字)。
  • \d{6,11}:匹配连续6到11位数字。
  • (?!\d):负向后瞻,确保目标数字后面没有其他数字(即,后面不是一个数字)。

示例 PHP 代码

<?php
$input = "654654658";  // 目标输入

// 正则表达式
$pattern = '/(?<!\d)\d{6,11}(?!\d)/';

// 查找匹配项
if (preg_match($pattern, $input, $matches)) {
    echo "匹配到的数字是: " . $matches[0];
} else {
    echo "没有匹配到符合条件的数字";
}
?>

说明:

  • preg_match 函数用于匹配目标字符串中的数字。
  • 如果匹配成功,会输出符合条件的数字,否则会输出“没有匹配到符合条件的数字”。

示例:

  • 输入 654654658 会输出 654654658
  • 输入 6546596154984654656746 会输出 "没有匹配到符合条件的数字",因为这个字符串中的数字连续过长,超过了 11 位。

实际应用:匹配出字符串中的电话和微信、QQ

    /**
     * 匹配出字符串中的电话和微信
     * @param $content
     * @return string[] [电话,微信,QQ号]
     */
    public static function matchPhoneWeixin($content)
    {
        // 国内手机号(13568568454)
        $regPhone = '#(?<!\d)(1[3-9][\d]{9})(?!\d).*#'; //不能是电话后面还带数字的情况
        // 国际手机号(+8613568568454 +0086 13568568454)
        $regPhone2 = '#(\+\d{2,5}\s?[\d]{8,11})(?!\d).*#';
        // 微信号(必须以字母或者下划线开头,字母不区分大小写;可使用6-20个字母、数字、下划线和减号或它们的组合; 不支持设置中文)
        $regWeixin = '#([a-zA-Z_][a-zA-Z0-9_\-]{5,20})#';
        // QQ号(要求6-11位)
        $regQQ = '#(?<!\d)([1-9]\d{5,10})(?!\d).*#';
        $phone     = '';
        $weixin    = '';
        $qq        = '';
        $content   = preg_replace('/[\s]+/', '', $content); //去除空格
        if (preg_match($regPhone, $content, $match)) $phone = $match[1];
        if (preg_match($regPhone2, $content, $match)) $phone = $match[1];
        if (preg_match($regWeixin, $content, $match)) $weixin = $match[1];
        if (!$phone && !$weixin && preg_match($regQQ, $content, $match)) {
            if (
                mb_strpos($content, '微信') !== false ||
                mb_strpos($content, '+v') !== false ||
                mb_strpos($content, '+V') !== false ||
                mb_strpos($content, '加v') !== false ||
                mb_strpos($content, '加V') !== false ||
                mb_strpos($content, 'WX') !== false ||
                mb_strpos($content, 'vx') !== false ||
                mb_strpos($content, 'v') !== false ||
                mb_strpos($content, 'V') !== false
            ) {
                //这串数字识别为微信
                $weixin = $match[1];
            } else {
                //20241231,不用匹配为QQ号,容易误抓
                //20250303张老师:启用QQ号匹配,优化一下最大长度11位,提升正确率
                $qq = $match[1];
            }
        }
        return [$phone, $weixin, $qq];
    }