為什麼喜劇演員不用AI?原因之一在於OpenAI等阻止大模型產出冒犯型內容

人工智能擅長很多事情,比如發現數據中的規律,創建逼真的圖像,並將數千個單詞濃縮成幾個段落,但它寫出優秀的喜劇劇本和段子嗎?

新的研究表明,它可以,但只是在非常有限的範圍內。這是一個有趣的發現,暗示了人工智能在一定程度上可以幫助完成創造性工作,但也僅限於一定程度上。

彼得·米羅夫斯基(piotr mirowski)是谷歌 deepmind 的研究人員。在業餘時間,他也是一名即興喜劇演員。他和其他 deepmind 研究人員研究了在工作中使用人工智能的專業喜劇演員的經歷。

他們結合調查和焦點小組,旨在衡量人工智能在不同任務中的有用性。

他們發現,儘管 openai 和谷歌的流行人工智能模型在簡單的任務上很有效,比如構建獨白或製作粗略的初稿,但它們很難製作出原創、刺激或有趣的內容。

本月早些時候,他們在巴西里約舉行的 acm facct 會議上介紹了他們的發現,但為了避免演員們的聲譽受到損害,他們沒有透露參與者的名字(並非所有喜劇演員都希望觀眾知道他們使用了人工智能)。

研究人員要求 20 名已經在藝術創作過程中使用人工智能的專業喜劇演員使用大型語言模型,如 chatgpt 或谷歌 gemini(或 bard),來生成他們覺得在喜劇表演情景下很合適的內容。

他們可以用它來幫助創造新的笑話,或者重新打磨現有的喜劇素材。

實驗結果好壞參半。雖然喜劇演員們表示,他們在很大程度上喜歡使用人工智能模型來寫笑話,但他們對由此產生的素材並未感到特別自豪。

他們中的一些人說,人工智能可以用來在空白的紙上打草稿,幫助他們快速生成一些東西。

一位參與者將其比作“一個剛剛經歷頭腦風暴的初稿,我知道我必須不斷迭代和改進它”。

許多喜劇演員還指出了大型語言模型為喜劇小品(comedy sketch)生成結構的能力,而他們需要負責充實細節。

然而,大型語言模型生成的喜劇素材的質量還有很多不足之處。喜劇演員們認為模型的笑話十分平淡、普通和無聊。一位參與者將其比作“20 世紀 50 年代的游輪喜劇素材,但沒有那麼種族主義”。

其他人則認為付出的努力與回報不成正比。一位喜劇演員說:“不管我怎麼提示,它都只能給出一種非常拘謹的、線性的喜劇策略。”

人工智能無法生成高質量的喜劇素材並不奇怪。openai 和谷歌用來阻止模型產生暴力或種族主義內容的安全過濾器也阻礙了它們生成喜劇中常見的素材,如帶有冒犯性或性暗示的笑話和黑色幽默。

因此,大型語言模型只能依賴那些被認為是“更安全的”內容和信息,包括大量文檔、書籍、博客文章和其他類型的互聯網訓練數據。

米羅夫斯基說:“如果你製作的東西對每個人都有廣泛的吸引力,它最終會成為沒有人喜歡的東西。”

實驗還暴露了大型語言模型的偏見。幾位參與者發現,模型不會從亞洲女性的角度創作喜劇獨白,但可以從白人男性的角度創作。他們認為,這一現象強化了現狀,同時也抹殺了少數群體及其觀點。

事實上,阻止大型語言模型產生有趣內容的不僅僅是安全護欄和有限的訓練數據。

專門研究人工智能和創造力的美國哥倫比亞大學計算機科學研究員圖欣·查克拉博蒂(tuhin chakrabarty)表示,幽默在很大程度上依賴於令人驚訝和不協調的包袱,這與這些模型的工作方式不一致。

他補充說:“創造性寫作需要腦洞大開,而大型語言模型只能模仿它。” 他沒有參與這項研究。

他說:“喜劇,或任何一種優秀的作品,都會放長線(埋伏筆),最終目的是回歸主題或給觀眾帶來驚喜。大型語言模型很難做到這一點,因為它們只是一次預測一個單詞。”

“我在自己的研究中做了很多嘗試,試圖讓人工智能變得好玩、令人驚訝、有趣或有創意,但它根本不起作用。”其表示。

科琳·拉文(colleen lavin)是一名開發者和喜劇演員,她參與了這項研究。

2023 年,為了在愛丁堡藝穗節上表演一個單口喜劇(stand-up),她訓練了一個機器學習模型來識別笑聲,並在發現她沒有得到足夠多的笑聲時“質問”她。

雖然她使用生成式人工智能為自己的節目製作宣傳材料或檢查自己的語法,但她在使用它來生成笑話方面劃清了界限。

她說:“我每天的工作充斥着技術,而寫作與此無關,它彷彿是神聖而不可侵犯的。為什麼我要把我真正喜歡的東西外包給機器?”

查克拉博蒂說,雖然有人工智能輔助的喜劇演員可能工作得更快,但他們的想法不會是原創的,因為他們會受到模型訓練數據的限制。

他說:“我認為,人們無論如何都會用這些工具來寫劇本和廣告。但真正的創意和喜劇寫作是基於經驗和氛圍,而不是算法。”

支持:ren

運營/排版:何晨龍