fix(bilibili): 修正分P视频字幕优先链路未传p参数导致取错集 by wmsdsb · Pull Request #403 · JefferyHcool/BiliNote

wmsdsb · 2026-06-11T15:57:56Z

问题：B站分P视频（如62集课程），提交?p=36链接时，
字幕优先链路通过x/web-interface/view API拿cid时未传p参数，
默认取第1集cid，导致生成的是第1集的笔记。
同时yt-dlp正确下载了p36音频，但被跳过。

修复：

url_parser新增extract_bilibili_p_number()提取URL中的p参数
bilibili_subtitle的_get_cid()接收p参数，从data.pages[p-1]取对应分P的cid
fetch_subtitles()调用extract_bilibili_p_number()透传p

改动概述

修复 B 站分P视频提交 ?p=N 链接时，字幕优先链路未透传 p 参数，导致始终取第 1 集 cid 生成笔记。

为什么

B 站 x/web-interface/view API 默认返回第 1 集的 cid。分P视频（如 62 集课程）用户提交 ?p=36 时，extract_video_id() 只取了 BV 号丢掉了 p 参数，字幕链路用第 1 集的 cid 拉到第 1 集字幕，而 yt-dlp 下载的是正确的 p36 音频——两者对不上，GPT 基于错误的字幕生成笔记。

做了什么

backend/app/utils/url_parser.py: 新增 extract_bilibili_p_number() 从 URL 提取 ?p=N
backend/app/downloaders/bilibili_subtitle.py: _get_cid() 接收 p 参数，从 data.pages[p-1] 取对应分 P 的 cid；fetch_subtitles() 透传 p

测试方式

python -m py_compile backend/app/utils/url_parser.py 通过
python -m py_compile backend/app/downloaders/bilibili_subtitle.py 通过
手动验证步骤：
- 提交 https://www.bilibili.com/video/BV19uAfeQEbg/?p=36，检查笔记内容是否为柠檬酸循环（第36集）而非课程规划（第1集）
- 提交非分P视频链接，确认不受影响
- 查看日志确认 cid 取自 data.pages[p-1]

回归风险

非分P视频：无影响，fallback 取 pages[0]
分P序号超出范围：fallback 取 pages[0]（第1集）
短链接 b23.tv：先 resolve 再提取 p 参数
影响面仅限 B 站分P视频的字幕优先路径，不影响 yt-dlp 下载和 Whisper 转写

Checklist

分支命名遵循 CONTRIBUTING.md §3（feature/* / fix/* / release/* / hotfix/*）
base 分支正确（常规改动 → develop；线上紧急 → master；发版 → 见 §4.3）
Commit message 遵循 type(scope): subject 格式（CONTRIBUTING.md §5.1）
已自测核心流程
已更新相关文档（README.md / CHANGELOG.md / CLAUDE.md / 模块 README，如适用）
未夹带 secrets / .env / 大型二进制
单 PR 不跨多个工作区做无关改动

问题：B站分P视频（如62集课程），提交?p=36链接时，字幕优先链路通过x/web-interface/view API拿cid时未传p参数，默认取第1集cid，导致生成的是第1集的笔记。同时yt-dlp正确下载了p36音频，但被跳过。修复： - url_parser新增extract_bilibili_p_number()提取URL中的p参数 - bilibili_subtitle的_get_cid()接收p参数，从data.pages[p-1]取对应分P的cid - fetch_subtitles()调用extract_bilibili_p_number()透传p

Copilot

Pull request overview

该 PR 修复了 B 站分 P 视频在“字幕优先”链路中未透传 ?p=N，导致通过 view API 取错 cid（默认第 1 集）从而生成错误笔记的问题，使字幕获取与 yt-dlp 下载的音频集数一致。

Changes:

新增 URL 工具函数 extract_bilibili_p_number()，用于从 B 站链接中解析分 P 序号 p。
字幕拉取链路在取 cid 时透传 p 并从 data.pages[p-1] 选择对应分集的 cid。
日志与返回的 raw 元信息中补充 p 字段，便于排查与追踪。

Reviewed changes

Copilot reviewed 2 out of 2 changed files in this pull request and generated 4 comments.

File	Description
backend/app/utils/url_parser.py	增加从 B 站 URL 提取分 P 参数 `p` 的解析能力（含短链处理与尾缀形式）。
backend/app/downloaders/bilibili_subtitle.py	在字幕优先路径中透传 `p` 并按分 P 选择正确 `cid`，避免取到第 1 集字幕。

💡 Add Copilot custom instructions for smarter, more guided reviews. Learn how to get started.

@@ -1,5 +1,5 @@
 import re
-from typing import Optional
+from typing import Optional, Tuple


+    # 匹配 /pN 尾缀形式（较少见）
+    match = re.search(r'/p(\d+)(?:/?$|\?|&)', url)
+    if match:
+        return int(match.group(1))


 from app.services.cookie_manager import CookieConfigManager
 from app.utils.logger import get_logger
-from app.utils.url_parser import extract_video_id
+from app.utils.url_parser import extract_video_id, extract_bilibili_p_number


    def fetch_subtitles(self, video_url: str) -> Optional[TranscriptResult]:
        bvid = extract_video_id(video_url, "bilibili")
        if not bvid:
            logger.info("无法从 URL 提取 BV id")
            return None

-        cid = self._get_cid(bvid)
+        # 提取分 P 序号
+        p = extract_bilibili_p_number(video_url)
+


huangjianwu and others added 3 commits June 7, 2026 02:05

Merge branch 'release/2.4.0' into develop

24b4d4c

Merge branch 'master' into develop

71c931b

JefferyHcool requested a review from Copilot June 15, 2026 02:26

Copilot started reviewing on behalf of JefferyHcool June 15, 2026 02:26 View session

Copilot AI reviewed Jun 15, 2026

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

fix(bilibili): 修正分P视频字幕优先链路未传p参数导致取错集#403

fix(bilibili): 修正分P视频字幕优先链路未传p参数导致取错集#403
wmsdsb wants to merge 3 commits into
JefferyHcool:masterfrom
wmsdsb:fix/bilibili-multipart-p-number

wmsdsb commented Jun 11, 2026 •

edited

Loading

Uh oh!

Copilot AI left a comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

wmsdsb commented Jun 11, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

改动概述

为什么

做了什么

测试方式

回归风险

Checklist

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Pull request overview

Reviewed changes

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

wmsdsb commented Jun 11, 2026 •

edited

Loading