為了響應偉大的白熊老師關於【2025 台灣人工智慧年會】的報導,我也貢獻一篇文章,因此我問白熊老師說,大家會比較想要看怎樣的文章呢?偉大的白熊老師開示兩個重點:
- 避掉 AI 幻覺
- 生文生圖生片都不想要那麼重的 AI 塑膠感。
話不多說,我們看看成果如何,再來聊是如何煉成的:
1. 示範文章:《沙漠玫瑰與她的異國朋友圈》
從沙漠吹來的一首歌
2000 年,你或許在 Jaguar 汽車廣告裡聽過那首迷人歌曲——Sting 的 《Desert Rose》。英國紳士遇上阿爾及利亞歌手 Cheb Mami,一邊英文低吟,一邊阿拉伯語高歌,結果兩人歌詞內容完全沒對過稿,卻神奇地唱出了同樣的「愛與渴望」。音樂就是這樣,它不需要翻譯。
《Desert Rose》意外紅到爆,不只賣車賣專輯,還把阿拉伯流行樂推進了西方主流。這首歌就像一張通往異域的機票,讓聽眾瞬間穿越到沙漠夜晚。
異國朋友圈名單
如果《Desert Rose》是一場派對,那她的朋友圈肯定精彩絕倫:
- Shakira《Ojos Así》:拉丁女神帶著黎巴嫩血統,把西班牙語和阿拉伯吟唱混進舞池,性感又神秘。
- The Chemical Brothers《Galvanize》:摩洛哥弦樂取樣+電子舞曲,像是你在馬拉喀什夜市被 DJ 拉去跳街舞。
- Amr Diab《Habibi Ya Nour El Ain》:阿拉伯世界的神曲,甜到像在地中海喝薄荷茶,還有人替你彈吉他。
- The Clash《Rock the Casbah》:龐克樂隊嘲諷「禁止搖滾」的荒謬故事,結果比誰都更搖滾。
- Hakim & Don Omar《TIJI TIJI》:阿拉伯語對上西班牙語,達布卡鼓遇上雷鬼低音,舞池外交立刻成功。
- Led Zeppelin《Kashmir》:搖滾史詩,靈感來自摩洛哥公路旅行,聽起來像要帶你穿越沙漠去冒險。
- Nusrat Fateh Ali Khan & Massive Attack《Mustt Mustt》:蘇菲祈禱歌混上電子低音,靈性與迷幻完美合體。
音樂無國界,只有節奏感
這些作品證明,音樂比交友軟體還懂「速配」。它能把不同文化的聲音拉到同一個舞池裡,談戀愛、開派對、搞諷刺,樣樣行。
Sting 的《Desert Rose》不是孤例,而是一個信號:當西方流行遇上東方神秘,結果往往比想像中更浪漫、更酷炫。
所以下次別只刷排行榜單曲,勇敢點進一首語言看不懂的歌吧。誰知道呢?也許下一朵讓你心動的「沙漠玫瑰」,就在異國旋律裡。
2. 我們如何達到(偉大的)白熊老師的要求?
白熊老師的第一點要求就是避掉AI幻覺,所以肯定不能直接叫 AI 直出一篇文章,而是要運用 Deep Research 深度研究功能。簡單地說,就是依照你的要求去進行搜索與彙總。黃仁勳愛用的 Perplexity 就是以此功能成為黑馬的,但現在兩大AI聊天機器人 ChatGPT 與 Gemini 免費版都支援此功能。我個人覺得 Gemini 彙總的資料最為詳盡,因此在本篇文章中,我們會交叉使用 ChatGPT 與 Gemini 來完成一篇音樂報導。
我們模擬一個情境,你忽然聽到一首喜歡的歌,然後以此為延伸寫出一篇報導。因此第一步是與 ChatGPT 詢問這首歌的特色,以作為後續研究的基礎。
提示詞:
我最近迷上了Sting《Desert Rose》這首歌,我很喜歡這首歌的氛圍與特色,請介紹這首歌的特色
我們可以把這個步驟稱為「定義範疇」,在這個例子中,我們將 Sting 的《Desert Rose》這首歌整理出特色,讓我們能夠以 ChatGPT 的深度研究進行搜索與彙總。
接著,點擊「詢問任何問題」左邊的加號按鈕,開啟進階功能選單,並點擊「深入研究」。
有件事情要注意,深入研究無論是在 ChatGPT 或 Gemini 的免費/付費版本,都是有每月限額的,所以務必省著點用。確認開啟深入研究後,就可以讓 ChatGPT 繼續做事了。
提示詞:
好的,請詳細研究與Sting《Desert Rose》這首歌類似音樂風格與氛圍與影響與文化意義的歌曲,並給我一份詳細的介紹
ChatGPT 的深度研究通常會與你確認一些細節,當你把這些細節補齊之後,它就會開始研究,通常需要5分鐘左右的時間,你可以先放著不管。
提示詞:
1. 是的
2. 是的
3. 是的
另外,沒有特定年代或語言偏好
研究完成後會產生一篇文章,就是我們剛剛從 Sting 的《Desert Rose》這首歌擴展為相似歌曲介紹的成果。
如果你真的很滿意這個研究成果,那你可以從這個成果再去彙總成新文章。但是, Gemini 的 Deep Research 通常會有更詳盡的結果,所以我會建議把 ChatGPT 的研究結果匯出成 Word 檔案,再交給 Gemini 進一步補充。
點擊文章區塊(它有個正式名稱叫做「畫布 Canvas」)右上角的匯出按鈕,你會看到下載文章 PDF 或 Word 檔的選單。
我們將 ChatGPT 的研究結果匯出成 Word 檔案上傳給 Gemini ,並跟它補充一些資訊。例如我們剛剛忘記要把 Sting 的《Desert Rose》也納入歌單,以及驗證 ChatGPT 的研究結果是否屬實,最後再多補充一些關於收集內容的細節指引。
開啟 Gemini ,我們要在它的對話框下點擊 Deep Research ,啟用深入研究。再強調一次,深入研究無論是在 ChatGPT 或 Gemini 的免費/付費版本,都是有每月限額的!省著點!
並且點擊對話框下側選單最左邊的加號按鈕,開啟進階選單。以「上傳檔案」功能將 ChatGPT 的研究結果的 Word 檔案上傳到 Gemini 。
接著輸入提示,就可以讓 Gemini 繼續做事了。
提示詞:
我最近迷上了Sting《Desert Rose》這首歌,並準備了類似歌曲的參考資料。請參考上傳的檔案的歌曲介紹,為我確認這些介紹的內容正確無誤,並尋找更多類似歌曲,也將Sting《Desert Rose》這首歌納入介紹的歌曲清單,且補充這些歌曲的介紹或趣聞等資訊,讓我能夠完成一份豐富而有魅力的報導
Gemini 的 Deep Research 很棒的一點是,它會告訴你研究計畫的內容,所以你可以仔細檢查它的研究目標是否與你預期的相同。
沒有問題的話,點擊「開始研究」即可。Gemini 的 Deep Research 有時會耗時超過十分鐘,甚至長達半小時以上。所以,建議你別等它,你會在電腦前睡著,所以不如去床上先去睡一下吧。Gemini 甚至會讓你看到研究過程,也就是它如何透過反覆的搜尋與彙整,達到它認定的知識飽和水準。
當 Gemini 的 Deep Research 研究完成,你一樣會獲得一篇文章。依照我的經驗,通常篇幅會是 ChatGPT 深度研究的兩倍,所以你就知道我為何推薦 Gemini 的 Deep Research 了。但它有個小小的毛病,不能直接匯出 Word 檔案,而且直接複製內容會跑版到令人崩潰,因此我建議匯出至 Google 文件。
然後我們就到 Google 文件來把它存成 Word 檔案。
Gemini 的 Deep Research 超讚,但它生成文章的風格上沒有 ChatGPT 靈活,所以我們又回到 ChatGPT 。
開啟 ChatGPT 的進階選單,點擊「新增照片與檔案」功能,將 ChatGPT 自己產生的文章 Word 檔案與 Gemini 研究成果的 Word 檔案上傳上來。因為整個過程都是透過 Deep Research 收集的資訊,所以幻覺的機率很低。
接著,我指定了要撰寫哪種風格的音樂介紹文章,並指定文章的脈絡。
提示詞:
請參考我提供的兩個文件,撰寫一篇為非樂迷的一般大眾探索當代跨文化音樂的報導,以輕鬆、幽默、有趣的角度,從Sting的《Desert Rose》開始,介紹其魅力與特色,再延伸至其他類似的歌曲介紹
ChatGPT 第一次生成的文章其實已經可以用了,但它推薦我另外生成「雜誌專欄」版本來看看,我通常都會同意,多生成幾個版本來比較會更好。
到這個步驟產生的「雜誌專欄」版本,就是本文開頭的範例文章了。
接著,我們嘗試讓 ChatGPT 直接依照文章內容產生配圖。如果沒有指定視覺元素,它通常會把文章元素直接拼成一張圖,缺少特色與氣氛,就像下圖的例子。
提示詞:
幫我為這篇報導設計一張16:9比例的配圖
因此,我們可以跟 ChatGPT 討論,我們該如何設計配圖的視覺元素。
提示詞:
你覺得這篇報導的配圖,如果不以歌手為主題,而是以異國風情為主題,該如何設計這張配圖呢?
如果有你滿意的,就以 ChatGPT 提供的描述作為生成圖片的提示。
提示詞:
以沙漠與都市交融的畫面來設計16:9比例的配圖主視覺: 沙漠黃沙延伸至地平線,但遠方逐漸出現摩天大樓、霓虹燈或音樂節舞台。
細節元素: 沙丘上擺放阿拉伯琵琶(Oud)、西班牙吉他、DJ 打碟盤,像是「樂器考古現場」。
氛圍: 古老與現代碰撞,展現音樂跨文化的張力。
因為 Sting 的 《Desert Rose》有電子樂的元素,因此我想把配圖的氛圍改成電子迷幻感。
提示詞:
請保留主視覺與細節元素,將氛圍改成科技感、帶有電子音樂風格,來設計16:9比例的配圖
最後,我覺得以寫實照片來呈現更好,完成了這篇文章的配圖。
提示詞:
請將上面這張圖片改成寫實照片,生成充滿電子樂與迷幻風格的16:9比例的配圖
3. 結語:是與 AI 協作,不是都丟給 AI 做,才能擁有你的風格
在這個例子中,我們看到了如何從一首歌延展出足夠讓你聽一下午的歌,並生成介紹這些歌曲的文章。同時我們也透過生成配圖的過程看到,如果沒有在生成提示中加入你的個人喜好,那結果通常不會太好。
此我很強調, AI 改變人類的學習模式,讓我們得以快速掌握資訊脈絡,然後我們人類再以自身對這些脈絡的感性,來指引 AI 的生成內容。
希望這篇文章對你有幫助!