Voice+AI工作流 思考可以有聲(黃岳永)
筆者的一位校長朋友,最近跟我分享他的一個習慣──每次駕車時就開始講話,然後用iPhone記下來。他不是在作演講練習,而是將自己的想法「說出來」,可以是開會之後的反思、對教育趨勢的想法,甚至個人感受。他會把這些隨想片段錄下來,然後用人工智能(AI)整理成為To Do List、構思或報告。
思考產生想法,說話將想法表達出來,記憶則儲存了過去的經驗和知識,為思考和說話提供基礎和素材。仔細想想,說話是將思考過程中的想法、知識和判斷,透過語言表達出來,屬於把內部認知轉化為外部行為的過程。在這個過程中,我們其實已初步對資訊進行篩選。
筆者一向善於記住自己講過的話,也愛與AI交流見解,卻未必記得有時一閃而過的念頭,所以對於校長朋友的「將想法說出來」的工作流(Workflow)相當感興趣,開始想想自己可否也建立一套「Voice+AI」的第二大腦。

相對冷冰冰的文字,聲音本身的節奏以及說話時的用字,其實也是資訊的一部分,只要能好好記錄,然後交給AI協助整理、提煉、歸檔,整個「思考」過程就變得有跡可尋。
市面上已出現不少Voice AI 的產品。硬件方面,如AnkerWork M650、Plaud NotePin、HiDock P1;軟件方面,Wispr Flow就提供極完整的Workflow Library,讓用戶將錄音變成待辦事項、日程或文章草稿。
雖然我現時已經利用ChatGPT、NotebookLM、Perplexity等AI工具反思和整理,但錄音的第一步仍未最理想。想像中的理想流程應該是:任何時候講一句「要買牛奶了」,即時便加入To Do List;上課時學生提問與我的回答,會錄音並轉化為教學筆記;開會時的對話可以經AI摘錄重要概念、建議下一步行動,所有資料會自動同步入我Notion的第二大腦,根據CODA模型分類、追蹤與再發現。
不過,要達至這個目的,最大的挑戰是我不習慣「對着空氣講嘢」。
自言自語的總是令人覺得自己在繞圈子,所以我更偏向「對話」式思考──與ChatGPT或 Prof E一問一答,有時有情緒,有時有邏輯未通。透過AI回應、整理、再提出新角度,能幫我更快進入「清晰思考模式」。

在一個合適的空間、一個毋須表演的場域裏,聲音可以好好承載思想。AI不只是幫手抄錄,而是一位思考的朋友。現時產品未必支持對話式流程,但錄音與反思之間的橋樑已經出現。我們可以預視,未來的Voice+AI工作流,不止是輸入,更是一場場啟發性的對話。
更多黃岳永文章:
支持EJ Tech

