You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Voice+AI工作流 思考可以有聲(黃岳永)

By on September 23, 2025

本文作者黃岳永為香港科技大學副教授兼高級顧問(創業),為《信報》撰寫專欄「科網人語」。

筆者的一位校長朋友,最近跟我分享他的一個習慣──每次駕車時就開始講話,然後用iPhone記下來。他不是在作演講練習,而是將自己的想法「說出來」,可以是開會之後的反思、對教育趨勢的想法,甚至個人感受。他會把這些隨想片段錄下來,然後用人工智能(AI)整理成為To Do List、構思或報告。

思考產生想法,說話將想法表達出來,記憶則儲存了過去的經驗和知識,為思考和說話提供基礎和素材。仔細想想,說話是將思考過程中的想法、知識和判斷,透過語言表達出來,屬於把內部認知轉化為外部行為的過程。在這個過程中,我們其實已初步對資訊進行篩選。

筆者一向善於記住自己講過的話,也愛與AI交流見解,卻未必記得有時一閃而過的念頭,所以對於校長朋友的「將想法說出來」的工作流(Workflow)相當感興趣,開始想想自己可否也建立一套「Voice+AI」的第二大腦。

相對冷冰冰的文字,聲音本身的節奏以及說話時的用字,其實也是資訊的一部分,只要能好好記錄,然後交給AI協助整理、提煉、歸檔,整個「思考」過程就變得有跡可尋。

市面上已出現不少Voice AI 的產品。硬件方面,如AnkerWork M650、Plaud NotePin、HiDock P1;軟件方面,Wispr Flow就提供極完整的Workflow Library,讓用戶將錄音變成待辦事項、日程或文章草稿。

雖然我現時已經利用ChatGPT、NotebookLM、Perplexity等AI工具反思和整理,但錄音的第一步仍未最理想。想像中的理想流程應該是:任何時候講一句「要買牛奶了」,即時便加入To Do List;上課時學生提問與我的回答,會錄音並轉化為教學筆記;開會時的對話可以經AI摘錄重要概念、建議下一步行動,所有資料會自動同步入我Notion的第二大腦,根據CODA模型分類、追蹤與再發現。

不過,要達至這個目的,最大的挑戰是我不習慣「對着空氣講嘢」。

自言自語的總是令人覺得自己在繞圈子,所以我更偏向「對話」式思考──與ChatGPT或 Prof E一問一答,有時有情緒,有時有邏輯未通。透過AI回應、整理、再提出新角度,能幫我更快進入「清晰思考模式」。

在一個合適的空間、一個毋須表演的場域裏,聲音可以好好承載思想。AI不只是幫手抄錄,而是一位思考的朋友。現時產品未必支持對話式流程,但錄音與反思之間的橋樑已經出現。我們可以預視,未來的Voice+AI工作流,不止是輸入,更是一場場啟發性的對話。

更多黃岳永文章:

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們