You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

善用提詞 學懂「用圖思考」(黃岳永)

By on December 16, 2025

本文作者黃岳永為香港科技大學副教授兼高級顧問(創業),為《信報》撰寫專欄「科網人語」。

生成式人工智能(GenAI)圖像工具快速發展,對習慣「看圖思考」的人士而言,絕對是一個福音。要知道,過往若要把一個概念整理至可以圖像顯示,絕非易事;如今透過Gemini 3配合Nano Banana Pro,可直接達成「閱讀—思考—圖解—表達」的「一條龍服務」,把複雜概念轉化為可閱讀、可重用的資訊圖表。

筆者一向喜歡用圖來記憶和思考,多年以來在Pinterest胡亂Pin圖:見到有趣的資訊設計、構圖或配色,就順手「釘」起來,慢慢變成一塊又一塊的靈感Pinboard。這些看似雜亂的收藏,其實就是個人的視覺記憶;Pinterest的AI又會持續推送相似圖片,筆者亦在不知不覺間,在Pinterest建立了一個「視覺第二大腦」。

以往這些圖頂多成為「靈感庫」,難以真正系統化重用。多得AI的發展,現在可以先從Pinboard選出幾張接近自己想做的Infographic風格的圖片,下載後再上傳至Gemini 3,然後很簡單地下指令:「Describe this image」,請它分析版面結構、文字層級、圖像語彙、色彩與氣氛。以上等於叫AI幫忙做一次視覺Reverse Engineering,把原本直覺主導的喜好,變成可書寫、可重用的風格語言。

之後,就可以把這段風格說明嵌入自己為Nano Banana Pro設計的Prompt(提詞)模板:清楚寫明這是一張什麼格式的Infographic、受眾是什麼人、在什麼渠道使用,再具體交代故事結構。這種「先拆解、後安裝」的Prompt Engineering,使得每次生成新圖,都能在風格與排版上保持高度一致,又可以按內容微調,是一種把個人審美「編碼化」的過程。

圖像只是Front-end,背後仍然要有扎實內容支持。筆者愛用的CODA工作流程:收集(Collect)、組織(Organize)、提煉(Distill)、行動(Action),為知識型工作流程提供一條清晰主線,而在AI時代,每一個階段都可以由不同工具接力。

筆者做法大概如下:收集階段,先找幾條解說影片快速了解一下,再配合電子書與長文,全部轉成PDF或文字稿,成為統一標準格式,方便之後輸入NotebookLM、ChatGPT等工具。組織和提煉兩個階段,NotebookLM顯得特別有用,亦習慣用ChatGPT自我提問。

行動階段,過去多是寫專欄或網誌,如今加插多一層:用Midjourney等模型嘗試做一些敍事性較強的插圖或Storyboard,描繪使用情景;然後再交由Nano Banana Pro負責「收尾」,排成可以直接放進簡報或報章的資訊圖表。

第一次用Gemini 3配合Nano Banana Pro做Infographic,感覺頗像踏進另一個層次的AI時代:不單是「畫圖好看」,而是開始講求精準(Precision)、一致(Consistency),以及可反覆調用的Prompt結構。對習慣「看圖思考」的人士,這是一個把閱讀、思考、圖解、表達串成一條可複製學習流程的契機。這年代拉開差距的,不是所使用的工具,而是能否善用AI,將想法轉化為精簡而清晰的文字指令。

更多黃岳永文章:

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們