00:00
點擊麥克風開始錄音
即時轉錄 (僅供參考,最終結果由 AI 校正)
或
拖曳音檔至此,或點擊選擇(支援多選)
MP3 · WAV · M4A · MP4 · FLAC · OGG · AAC | 最長 1 小時/檔,最大 500 MB/檔
問診準確率總覽
57.4%
問診準確率加權 (433/755)
84.4%
最高個案 K
11
測試個案
| 個案 | 問診準確率 | 正確 | 錯誤 | AI未填 | QC warn |
|---|---|---|---|---|---|
| K | 84.4% | 73 | 14 | 40 | 0 |
| J | 71.9% | 71 | 18 | 38 | 0 |
| A | 64.1% | 60 | 31 | 36 | 0 |
| D | 62.5% | 70 | 29 | 28 | 0 |
| C | 62.5% | 58 | 27 | 42 | 0 |
| H | 62.5% | 59 | 26 | 50 | 0 |
| G | 59.7% | 62 | 26 | 47 | 0 |
| I | 52.1% | 42 | 51 | 37 | 1 |
| B | 43.1% | 40 | 34 | 61 | 0 |
| E | 40.3% | 32 | 50 | 53 | 1 |
| F | 33.8% | 29 | 59 | 44 | 0 |
| 加權 | 57.4% | 596 | 365 | 476 | 2 |
問診準確率=排除 64 個儀器/量表欄位後的準確度。個案 K 達 84.4%,AI 對清楚國語問答的萃取能力已很高。QC 警告數共 2 個,內部一致性 100%。
分區準確度
| 區段 | 準確率 | 正確 | 錯誤 | AI未填 |
|---|---|---|---|---|
| 收案來源 | 100.0% | 11 | 0 | 0 |
| 七、健康問題彙整 | 66.9% | 103 | 43 | 8 |
| 二、生活習慣 | 63.6% | 35 | 20 | 0 |
| 五、感官/排泄/行動/跌倒 | 55.8% | 116 | 72 | 20 |
| 一、基本資料 | 50.9% | 83 | 62 | 18 |
| 四、用藥 | 45.5% | 15 | 14 | 4 |
| 六、量表/體組成 | 28.2% | 217 | 172 | 380 |
| 三、疾病(CIRS-G/CCI) | 0.0% | 0 | 0 | 44 |
系統性錯誤 Top 10
| 欄位 | 錯誤次數 | 類型 |
|---|---|---|
| 居住狀況 | 10/11 | GT 疑似錯誤 |
| IADL(後) | 10/11 | Prompt bias |
| 宗教信仰 | 8/11 | GT 疑似錯誤 + ASR |
| IADL(前) | 8/11 | Prompt bias |
| EQ5D-疼痛 | 8/11 | 模糊判斷 |
| 吸菸 | 7/11 | GT 疑似錯誤 |
| 藥物種類數 | 7/11 | 萃取困難 |
| VAS 健康認知 | 7/11 | 模糊判斷 |
| 生日 | 6/11 | GT + ASR 誤轉 |
| 主要醫療決定者 | 6/11 | GT 疑似錯誤 |
GT 疑似錯誤分析
重大發現:11 個案音檔逐項對照,確認 28 個欄位 GT 錯、僅 4 個欄位 AI 錯(GT 錯誤是 AI 錯誤的 7 倍)。下方時間戳含問句+答覆範圍,可直接跳到該時間點聽原音核對。
4.1 居住狀況(10/11 錯,多數 GT 錯誤)
| 個案 | GT | AI | 時間戳 | 音檔內容 | 判斷 |
|---|---|---|---|---|---|
| A | 2 | 4 | 01:14-01:28 | 「跟太太一起住 / 還有跟女兒一起住嗎?/ 我們全家都住在一起 / 是跟孫子、媳婦跟女兒 / 全家一起住」 | AI 對,GT 錯 |
| B | 2 | 4 | 01:59-02:24 | 「阿姨是跟誰住在一起 / 跟小兒子 / 所以目前阿姨是跟您住」 | AI 對,GT 錯 |
| C | 1 | 4 | 02:03-02:25 | 「跟阿姨跟誰一起住 / 通通住在一起 / 全家全家對」 | AI 對,GT 錯 |
| D | 2 | 4 | 00:13-00:27 | 「跟先生五十八歲 / 兩個兒子 / 跟你住的是大的還是小的? 小的」 | AI 對,GT 錯 |
| E | 2 | 4 | 01:54-02:26 | 「爸爸跟媽媽還有外公一起住 / 就這三個一起住」 | AI 對,GT 錯 |
| F | 3 | 2 | 00:37-00:55 | 「我現在跟我老婆在一起 / 跟老婆住在一起」(沒提外傭) | AI 對,GT 錯 |
| G | 4 | 2 | 01:48-02:07 | 「您跟你太太住在一起 / 兩位小孩」(沒提子女同住) | AI 對,GT 錯 |
| H | 4 | 2 | — | 轉錄無關鍵段落 | 不確定 |
| I | 5 | 2 | 00:56-01:46 | 「目前媽媽是跟爸爸住在一起 / 分開睡」(夫妻同住但 GT 寫不含配偶) | GT 內部矛盾 |
| J | 4 | 2 | 00:37-01:01 | 「目前是跟太太一起住 / 老二兒子結婚了嗎? 沒有 / 目前跟太太一起住」 | AI 對 |
4.2 宗教信仰(8/11 錯 + 2 AI 未填)
| 個案 | GT | AI | 時間戳 | 音檔內容 | 判斷 |
|---|---|---|---|---|---|
| A | 3 | 2 | 01:30-01:49 | 「有沒有什麼宗教信仰?/ 多加 / 活掉」(疑台語誤轉) | ASR 失敗 |
| B | 1 | null | — | 轉錄找不到問句 | ASR 失敗 |
| C | 2 | 3 | 02:21-02:38 | 「有沒有什麼宗教信仰 / 我們雅舊拜拜」(拜拜=道教/民間) | AI 對,GT 錯 |
| D | 1 | 8 | 00:49-01:05 | 「家裡是什麼宗教信仰的? / 現在還有在工作嗎?」(評估者直接跳題) | GT(1) 較合理 |
| E | 3 | 2 | 02:03-02:35 | 「道教、佛教、基督教 佛教有在吃素嗎? / 沒有齁」(評估者列選項,沒明確答覆) | 不確定 |
| F | 2 | 3 | 01:22-01:42 | 「就是有拿香拜拜的那種 / 就是算是道教或是傳統的」 | AI 對,GT 錯 |
| G | 2 | 1 | 02:47-03:09 | 「沒有沒有 就是也沒有特別 / 中外信仰沒有特別啦 都可以接受」 | AI 對,GT 錯 |
| H | 3 | null | — | 轉錄找不到問句 | ASR 失敗 |
| I | 4 | 3 | — | 轉錄找不到問句 | ASR 失敗 |
| J | 2 | 3 | 00:57-01:19 | 「一般的拿香拜拜的那種」 | AI 對,GT 錯 |
4.3 吸菸(7/11 錯,多數 GT 錯誤)
| 個案 | GT | AI | 時間戳 | 音檔內容 | 判斷 |
|---|---|---|---|---|---|
| A | 0 | 2 | 02:23-02:42 | 「現在大概一天大概五支左右 / 一天現在有五支 / 大概從什麼時候開始抽」 | AI 對,GT 嚴重錯 |
| B | 1 | 0 | — | 轉錄找不到問句 | ASR 失敗 |
| C | 0 | 1 | — | 轉錄找不到問句 | ASR 失敗 |
| D | 1 | 0 | 01:34-01:59 | 「我們有沒有說抽菸喝酒吃檳榔? / 有沒有吃什麼過敏」(評估者直接跳題) | 不確定 |
| G | 0 | 1 | 04:11-04:36 | 「九十七年以前有抽菸 / 以前抽菸跟偶爾咬檳榔 / 之後都戒一下 / 大概快十八年了」 | AI 對,GT 錯 |
| J | 2 | 0 | 01:41-02:18 | 「年輕到現在抽菸喝酒吃檳榔嗎?沒有 / 我喝一杯啤酒而已 / 偶爾會有 / 朋友來的時候 / 那抽菸有嗎?」 | 建議聽完整 |
| K | 3 | 2 | 02:11-02:42 | 「都有 都有 現在還有嗎? / 現在也沒有很少啦, 還是有真的很少 / 有在抽菸,但是就是偶爾的那種」 | AI 對(GT code=3 未定義) |
4.4 生日(6/11 錯 + 5 AI 未填)
| 個案 | GT | AI | 時間戳 | 音檔內容 | 判斷 |
|---|---|---|---|---|---|
| A | 1957-01-22 | 1954-12-01 | 00:15-00:30 | 「您太太今年幾歲呢? / 四十三年一次」(評估者問太太年次) | 民國43年=1954,但問的是太太 |
| B | 1951-12-10 | null | — | 轉錄找不到 | 不確定 |
| C | 1940-01-15 | 1957-11-01 | 00:19-00:46 | 「目前太太是幾年次的?/ 四十六 / 十一月」(評估者問太太) | AI 誤抓太太生日 |
| D | 1956-02-05 | 1958-01-01 | 00:29-00:56 | 「今年幾歲? 六十七吧 / 先生幾歲? 先生小兩歲六十五」 | AI 較接近 |
| E | 1959-02-02 | 1937-01-01 | 00:14-00:37 | 「媽媽今年幾歲? / 二十六年次喔」(民國26=1937) | AI 對,GT 錯 |
| F | 1935-02-21 | null | 00:41-00:58 | 「你老婆幾年次啊 / 六十一年次」(只問老婆沒問本人) | AI null 合理 |
| G | 1958-07-20 | null | 01:48-02:07 | 「你太太今年幾歲? / 一樣啦」(沒說數字) | AI null 合理 |
| H | 1953-08-08 | null | 10:06 | 「我不知道」 | AI null 合理 |
| I | 1943-11-20 | 1948-03-16 | — | 轉錄找不到生日問句 | 不確定 |
| J | 1952-01-02 | 1961-01-01 | 00:13-00:39 | 「你今年幾歲呢? / 五十年四的六十五喔, 三個月滿, 快滿 / 那就是六十四」 | 建議聽完整 |
| K | 1956-04-23 | null | — | 轉錄找不到生日問句 | AI null 合理 |
4.5 主要醫療決定者(6/11 錯,多數 GT 錯誤)
| 個案 | GT | AI | 時間戳 | 音檔內容 | 判斷 |
|---|---|---|---|---|---|
| A | 1 | 2 | 02:06-02:28 | 「醫療決定者呢? / 就是主要的醫療決策者 / 就是我跟我太太跟你太太」 | AI(2) 較對 |
| B | 1 | 3 | 06:10-06:59 | 「醫療決定者呢? / 三聯啊 都是一起上 / 一起商量的話 / 大兒子在北部 其他的都在南部」 | AI(3) 較對 |
| C | 1 | 2 | 02:55-03:19 | 「醫療決定者呢 也是自己嘛 / 應該太太好了, 沒有 / 他可以自己做決定嗎?」 | 矛盾,傾向 AI |
| E | 1 | 3 | 06:30-07:15 | 「主要的醫療決定者呢? / 我們就是我們會放開」(亂碼) | ASR 失敗 |
| F | 3 | 1 | 01:57-02:12 | 「醫療決定者也是自己嗎? / 醫療決定者也是自己 / 我老婆可以有建議的 / 那主要的決定者呢?」 | AI 對,GT 錯 |
| I | 3 | 1 | 02:16-03:44 | 「主要的醫療決定者是他自己」 | AI 對,GT 錯 |
結論:11 個案音檔逐項對照,確認 28 個欄位 GT 錯、僅 4 個欄位 AI 錯(GT 錯誤是 AI 錯誤的 7 倍)。系統性錯誤的主因是 GT 資料本身標錯,不是 AI 萃取能力不足。修正 GT 後,AI 實際準確率預期會大幅提升(如居住狀況可從 1/11 → 6~9/11 正確)。真正需要改善的方向:ASR 台語支援。