# 哈基米素材爬取摘要

本次围绕“爬哈基米的素材”检索并保留了 5 个可复核视频候选，其中包括 Bilibili 上直接命中的《哈基米原版 (20s retained sample)》以及 Wikimedia Commons 上适合做哈基米/可爱动物二创的猫咪动作素材。所有最终交付视频均已下载到 `outputs/samples/` 并上传到 Tobatsu CDN，报告和 `video_index.json` 使用 CDN retained URL，而不是第三方源站热链。例如首个样本 CDN：https://cdn-tobatsu.funplus-marketing.ai/outputs/c43c4a61-b310-408f-9c5e-71bdfe225b94/bilibili-hakimi-original。

检索过程使用了 Playwright 浏览器快照检查 Bing Videos 结果页，`curl` 抓取搜索/API/source 页面，`yt-dlp` 对可下载的视频结果进行保留采样，`ffprobe` 验证本地样本为真实视频。Wikimedia 后续下载触发 429 限速，因此只纳入已成功下载且大于 100 KB 的样本；失败尝试记录在 `.logs/` 中，未进入候选清单。
