# ASR 處理器版本說明 ## 三個版本對比 | 版本 | 模型 | 處理時間 | 準確度 | 適用場景 | |------|------|---------|--------|---------| | **tiny** | Whisper tiny | ~12 秒 | 70% | 快速預覽、測試 | | **base** | Whisper base | ~24 秒 | 75% | 平衡速度與準確度 | | **small** | Whisper small | ~50 秒 | 90% | 正式處理、台灣腔調 | ## 測試結果(ExaSAN 短影片) ### 關鍵詞彙識別 | 詞彙 | tiny | base | small | |------|------|------|-------| | **剪輯師** | ❌ 簡吉斯 | ❌ 簡吉斯 | ✅ 剪輯師 | | **調光師** | ✅ | ✅ | ✅ | | **錄音師** | ❌ | ❌ | ❌ | | **特效** | ✅ | ✅ | ✅ | | **套片** | ✅ | ✅ | ✅ | ### 片段數量 - **tiny**: 78 片段 - **base**: 61 片段(合併過度) - **small**: 83 片段(最細緻) ## 使用建議 ### 快速預覽(<15 秒) ```bash python3 scripts/asr_processor.py video.mp4 output.json ``` **適用場景**: - 快速查看影片內容 - 測試流程是否正常 - 不關心準確度 ### 平衡模式(~25 秒) ```bash python3 scripts/asr_processor_base.py video.mp4 output.json ``` **適用場景**: - 一般用途 - 速度與準確度平衡 - 非台灣腔調內容 ### 正式處理(~50 秒)⭐ 推薦 ```bash python3 scripts/asr_processor_small.py video.mp4 output.json ``` **適用場景**: - 正式生產環境 - 台灣腔調內容 - 專業詞彙識別(如剪輯師) - 需要高準確度 ## 比對工具 ### 使用比對工具 ```bash python3 scripts/compare_asr_models.py \ /tmp/asr_tiny.json \ /tmp/asr_base.json \ /tmp/asr_small.json > /tmp/asr_comparison.md ``` ### 檢視比對報告 ```bash cat /tmp/asr_comparison.md ``` ## 決策建議 ### 如果您需要 - **速度優先** → 使用 `tiny` 模型 - **平衡考量** → 使用 `base` 模型 - **準確度優先** → 使用 `small` 模型 ⭐ ### 針對台灣腔調 **強烈建議使用 `small` 模型**: - 唯一正確識別「剪輯師」 - 專業詞彙準確度最高 - 斷句最細緻 ## 檔案清單 ``` scripts/ ├── asr_processor.py # tiny 模型(原有,不修改) ├── asr_processor_base.py # base 模型(新增) ├── asr_processor_small.py # small 模型(新增) ├── compare_asr_models.py # 比對工具(新增) └── ASR_PROCESSOR_README.md # 本文件 ``` ## 測試記錄 ### 測試影片 - **檔名**: ExaSAN PCIe series - Director Ou Yu-Zhi Shares His Experience.mp4 - **時長**: 2 分 39 秒 - **語言**: 台灣國語(繁體中文) - **內容**: 影視後製討論 ### 測試結果 詳見 `/tmp/asr_comparison.md` ### 關鍵發現 1. **small 模型**是唯一正確識別「剪輯師」的模型 2. **base 模型**片段合併過度(61 vs 78 vs 83) 3. **tiny 模型**速度最快但準確度最低 ## 未來優化方向 ### 如果 small 模型仍不滿意 1. **添加後處理校正** - 建立專業詞彙校正表 - 自動修正常見錯誤 2. **添加上下文提示詞** - 提供影視後製專業詞彙列表 - 提升特定領域準確度 3. **考慮其他方案** - 阿里雲繁體中文 API(如果不能使用雲端則跳過) - 其他專門優化台灣腔調的模型 ## 聯絡與反饋 如有問題或建議,請提供更多測試樣本,我們會持續優化。