人工智慧可以創造出藝術嗎?
計算機的算法有助於我們選擇看哪一部電影,聽哪種音樂,讀哪類文學。
但是,如果算法本身超越了人類文化介質的角色,並開始自己創造文化,那會是怎樣一副光景?
1950年,英國數學家和計算機科學家艾倫圖靈發表了一篇論文《計算機器和智能》,並首先提出一種名為「模仿遊戲」的思想實驗。在一個房間裡是人類「詢問者」,在另外一個房間裡是一位男性或女性的「對話者」。遊戲的目標是讓「詢問者」判斷出隱藏在另一個房間裡的「對話者」是男是女。模仿遊戲要通過一系列問題與回答來完成,信息的收發要通過第三方或者打字進行。「贏」下模仿遊戲,意味著這個識別遊戲的第一步成功了。
之後,圖靈對模仿遊戲進行了修改,將其中一名「對話者」替代為計算機,觀察計算機能否順利的完成對話,並讓「詢問者」無法分辨計算機和人類「對話者」的區別。這個版本的模仿遊戲被稱為「圖靈測試」。
圖靈提出的這個簡單卻又功能強大的思想實驗,給出了一個通用的人工智慧測試框架,能夠研究人類與機器邊界的各個方面,而會話只是其中一個例子。
與人工智慧比寫詩
5月18日在美國常春藤大學之一的達特茅斯學院,計算機系和音樂系的教授與學生們將一起探討人工智慧的不同領域,關注機器創造藝術的問題。具體地說,在「藝術創作圖靈測試」中,我們將觀察參與者們能否區分人類和機器所創作的十四行詩、短篇小說、和音樂。當然,機器創作的藝術遠沒有莎士比亞、歐亨利和傻朋克那麼好。
舞曲比賽(「algorhythms」)要求參與者從一個預設的曲庫中選擇出最適合在舞池中使用的音樂,構建一個令人愉快的舞曲合集。在這種情況下,計算機軟體會從舞曲資料庫中隨機挑選一段音軌作為初始的「靈感種子」開始創作。該軟體會根據這段初始音軌,從曲庫中選擇、修改並混音,創造出15分鐘的舞曲。其中包括20個特徵的標準注釋,如體裁、節奏(bpm)、節奏點、飽和度(音高)和亮度(音色)。
十四行詩比賽(「poetix」)和短篇故事比賽(「digilit」)對於計算機來說更是嚴峻挑戰。比賽要求參與者提交獨立的軟體包,基於特定「靈感種子」,或輸入一個普通名詞短語(如「狗」或「奶酪刨絲器」),然後軟體再根據它來創作所需的文學作品。此外,參賽的軟體算法要求從一個給定的提示,產生無限數量的不同作品。
為了進行測試,我們會先瀏覽一遍電腦的「創作」,將明顯是機器產物的排除掉。我們將人類創作和機器創作混合在一起,然後請來一個小組的「裁判」,讓他們分辨這些藝術創作來自人還是機器。在舞曲創作的競爭中,我們交給了一群學生,讓他們分別伴隨著人類和機器創作的音樂來跳舞。在統計數據上和人類作品沒有區別的作品將會成為最終的「贏家」。
這個比賽對任何人都是開放的。到目前為止,參賽者包括了學者以及非學術從業者。然而截止到現在,沒有一家公司正式宣布參賽。這有點出乎我們的意料,畢竟文學領域的「機器寫作」公司已經如雨後春筍般出現,文字生成軟體的使用越來越普遍,如盈利報告和體育賽事總結等等。當然,在流媒體音樂播放領域,很多公司也在使用人工智慧進行自動化地列表生成,最著名的就是潘多拉。
對參賽作品的評判並不簡單。即使是在最初的模仿遊戲中,「對話者」的性別也要隨著時間的推移,才能逐漸透露,從文字中展露出來。相似的,在圖靈測試中,人們無法從單一交互實現中判斷計算機的話語缺乏人性,而需要一段較長時間的反覆測試。
模仿遊戲和圖靈測試的背景問題也是值得考慮的。贏得模仿遊戲的可能性,獨立於時間、文化和社會階層之嗎?很有可能在當前的西方社會,由於對性別的定義越來越靈活,原來的模仿遊戲將更難獲勝。圖靈測試也一樣,在二十一世紀,我們越來越多地和機器進行通訊。無論我們喜歡與否,簡訊和即時通訊應用已經極大地改變了我們的通訊方式以及對通訊本身的期望。在人們的交流中,縮寫、拼寫錯誤和信息遺漏幾乎是常態。同樣的問題也適用於藝術領域。
藝術家和創作輔助程序之間的界限在哪?誰才是藝術家?
對藝術形式的思考引出了另一個問題:誰才是藝術家?編譯了十四行詩創作軟體的程式設計師是詩人嗎?編譯了短篇小說創作軟體的程式設計師是作家嗎?編譯了音樂混音軟體的程式設計師是dj嗎?
藝術家和創作輔助程序之間的界限在哪?劃定這條界限對藝術成果的分類有何影響?十四行詩這種固定的藝術形式,是創造性工作的一種高層次算法——雖然是由人類所執行的。今天,當微軟的office軟體幫助你「糾正」語法錯誤並給你的用詞提出「建議」,而你又選擇聽從它(無論你是樂於接受,還是純粹的懶惰)的時候,你的創作還是你自己的嗎?還是已經變成了「人機合作產物」?
我們期待著看到「編程藝術家」提交更多的程序。不管這些程序的性能如何,也不管它們能否通過測試,他們的成果將會繼續開拓「創作」以及「人機協同進化」的邊界。
(作者:danieln.rockmore和michaelcasey;達特茅茨學院教授)
但是,如果算法本身超越了人類文化介質的角色,並開始自己創造文化,那會是怎樣一副光景?
1950年,英國數學家和計算機科學家艾倫圖靈發表了一篇論文《計算機器和智能》,並首先提出一種名為「模仿遊戲」的思想實驗。在一個房間裡是人類「詢問者」,在另外一個房間裡是一位男性或女性的「對話者」。遊戲的目標是讓「詢問者」判斷出隱藏在另一個房間裡的「對話者」是男是女。模仿遊戲要通過一系列問題與回答來完成,信息的收發要通過第三方或者打字進行。「贏」下模仿遊戲,意味著這個識別遊戲的第一步成功了。
之後,圖靈對模仿遊戲進行了修改,將其中一名「對話者」替代為計算機,觀察計算機能否順利的完成對話,並讓「詢問者」無法分辨計算機和人類「對話者」的區別。這個版本的模仿遊戲被稱為「圖靈測試」。
圖靈提出的這個簡單卻又功能強大的思想實驗,給出了一個通用的人工智慧測試框架,能夠研究人類與機器邊界的各個方面,而會話只是其中一個例子。
與人工智慧比寫詩
5月18日在美國常春藤大學之一的達特茅斯學院,計算機系和音樂系的教授與學生們將一起探討人工智慧的不同領域,關注機器創造藝術的問題。具體地說,在「藝術創作圖靈測試」中,我們將觀察參與者們能否區分人類和機器所創作的十四行詩、短篇小說、和音樂。當然,機器創作的藝術遠沒有莎士比亞、歐亨利和傻朋克那麼好。
舞曲比賽(「algorhythms」)要求參與者從一個預設的曲庫中選擇出最適合在舞池中使用的音樂,構建一個令人愉快的舞曲合集。在這種情況下,計算機軟體會從舞曲資料庫中隨機挑選一段音軌作為初始的「靈感種子」開始創作。該軟體會根據這段初始音軌,從曲庫中選擇、修改並混音,創造出15分鐘的舞曲。其中包括20個特徵的標準注釋,如體裁、節奏(bpm)、節奏點、飽和度(音高)和亮度(音色)。
十四行詩比賽(「poetix」)和短篇故事比賽(「digilit」)對於計算機來說更是嚴峻挑戰。比賽要求參與者提交獨立的軟體包,基於特定「靈感種子」,或輸入一個普通名詞短語(如「狗」或「奶酪刨絲器」),然後軟體再根據它來創作所需的文學作品。此外,參賽的軟體算法要求從一個給定的提示,產生無限數量的不同作品。
為了進行測試,我們會先瀏覽一遍電腦的「創作」,將明顯是機器產物的排除掉。我們將人類創作和機器創作混合在一起,然後請來一個小組的「裁判」,讓他們分辨這些藝術創作來自人還是機器。在舞曲創作的競爭中,我們交給了一群學生,讓他們分別伴隨著人類和機器創作的音樂來跳舞。在統計數據上和人類作品沒有區別的作品將會成為最終的「贏家」。
這個比賽對任何人都是開放的。到目前為止,參賽者包括了學者以及非學術從業者。然而截止到現在,沒有一家公司正式宣布參賽。這有點出乎我們的意料,畢竟文學領域的「機器寫作」公司已經如雨後春筍般出現,文字生成軟體的使用越來越普遍,如盈利報告和體育賽事總結等等。當然,在流媒體音樂播放領域,很多公司也在使用人工智慧進行自動化地列表生成,最著名的就是潘多拉。
對參賽作品的評判並不簡單。即使是在最初的模仿遊戲中,「對話者」的性別也要隨著時間的推移,才能逐漸透露,從文字中展露出來。相似的,在圖靈測試中,人們無法從單一交互實現中判斷計算機的話語缺乏人性,而需要一段較長時間的反覆測試。
模仿遊戲和圖靈測試的背景問題也是值得考慮的。贏得模仿遊戲的可能性,獨立於時間、文化和社會階層之嗎?很有可能在當前的西方社會,由於對性別的定義越來越靈活,原來的模仿遊戲將更難獲勝。圖靈測試也一樣,在二十一世紀,我們越來越多地和機器進行通訊。無論我們喜歡與否,簡訊和即時通訊應用已經極大地改變了我們的通訊方式以及對通訊本身的期望。在人們的交流中,縮寫、拼寫錯誤和信息遺漏幾乎是常態。同樣的問題也適用於藝術領域。
藝術家和創作輔助程序之間的界限在哪?誰才是藝術家?
對藝術形式的思考引出了另一個問題:誰才是藝術家?編譯了十四行詩創作軟體的程式設計師是詩人嗎?編譯了短篇小說創作軟體的程式設計師是作家嗎?編譯了音樂混音軟體的程式設計師是dj嗎?
藝術家和創作輔助程序之間的界限在哪?劃定這條界限對藝術成果的分類有何影響?十四行詩這種固定的藝術形式,是創造性工作的一種高層次算法——雖然是由人類所執行的。今天,當微軟的office軟體幫助你「糾正」語法錯誤並給你的用詞提出「建議」,而你又選擇聽從它(無論你是樂於接受,還是純粹的懶惰)的時候,你的創作還是你自己的嗎?還是已經變成了「人機合作產物」?
我們期待著看到「編程藝術家」提交更多的程序。不管這些程序的性能如何,也不管它們能否通過測試,他們的成果將會繼續開拓「創作」以及「人機協同進化」的邊界。
(作者:danieln.rockmore和michaelcasey;達特茅茨學院教授)