?

音樂人工智能的倫理思考
——算法作曲的“自律”與“他律”

2018-10-26 08:05付曉東

藝術探索 2018年5期

關鍵詞：八音盒自律人工智能

付曉東

（中國音樂學院音樂學系，北京 100101）

20世紀50年代至今，“人工智能”（AI）技術的發展經歷多次起落，近幾年突然以無可阻擋之勢席卷工業、金融、醫療、教育、運輸等各行業，并于2017年入選“2017年度中國媒體十大流行語”[1]，由此可見其勢頭之火熱?，F在，它正迅猛地向著音樂領域進軍，在未來十年內，越來越多未經人類大腦構思的音樂作品將會充斥于我們耳畔。音樂是一種主動侵入性的藝術，它不像視覺藝術那樣給人類保留以選擇權：如接受，駐足觀賞、定睛打量即可；如拒絕，轉移視線或索性閉眼即可。音樂以迅雷不及掩耳之速入侵，無法防備，人耳卻無法像數字濾波器一般對聲音信號進行信噪優化處理：如接受，必須將音樂信號連同所有的背景音響無條件地全部接受；如拒絕，只能捂上耳朵，屏蔽一切音響。所以，相對于其他藝術領域的人工智能技術的應用，音樂人工智能帶給我們的沖擊可能會更猛烈。

在展望音樂人工智能的前景時，計算機陣營可能會敲鍵相慶，音樂陣營可能會撫琴長嘆。音樂技能與理論的學習是一個漫長的過程。只有熟練掌握樂器演奏技術，基本樂理、作曲四大件的應用規則，龐雜繁復的音樂學相關理論，以及能夠敏銳地捕捉節奏、音高與織體，我們才能以之謀生。如今，人工智能突然出現，宣稱這一切學習過程都可以略去，無論是創作還是表演，一切交給機器。這個殘酷的現實讓音樂家震驚且疑惑。本文從傳統音樂陣營的立場出發，對音樂人工智能的倫理進行思考：AI要在多大程度上改變我們的音樂生活？在音樂領域內，何為“人工”，何為“自然”？何為“智能”，何為“機械”？或者，從藝術審美的層面來看，它有沒有邊界？

音樂美學理論界長久以來存在著兩種對立的觀點：一為“自律論”，一為“他律論”。所謂“自律論”，是指音樂的美存在于其自身的結構與形式之中，無關乎內容，也獨立于情感——簡而言之，音樂不需要抒情，音響本身的結構序列就是美。歐洲的代表人物有奧地利音樂學家漢斯立克，其代表作為《論音樂的美》，以及德國古典哲學創始人康德；中國的代表則是三國時期的嵇康，其代表為《聲無哀樂論》——魏晉玄學的千古名篇。所謂“他律論”，是指音樂的規律和法則受到外來因素，即人類情感的影響和制約。持此觀點的歐洲代表人物有舒曼、柏遼茲、李斯特等音樂家以及哲學家黑格爾；中國則以儒家音樂美學思想為代表，如孔子的“盡善盡美”，《尚書·舜典》的“詩言志，歌詠言，聲依詠，律和聲”，以及《禮記·樂記》所述“凡音之起，由人心生也。人心之動，物使之然也”，等等。

國內音樂理論界曾于20世紀末掀起了一場轟轟烈烈的有關“自律論”與“他律論”的爭論，可謂一場音樂美學的“真理標準大討論”。終于在世紀之交，理論界以辯證法的“自律與他律的矛盾統一”之定論將這場討論平息（或暫時平息）。筆者更傾向于“他律論”，在這里不闡述理由，只舉一個極端的例子：數學與物理中的公式、法則與定律，都體現了純粹的自律之美。但是當我們面對如質能公式E=mc2時，如果我們對相對論一無所知，對“一切物質都潛藏著質量乘于光速平方的能量”這個偉大命題絲毫不為所動，那么這個公式對于審視者只是一串不知所云的符號。再如同聆聽西洋交響樂，如果聽者對歐洲音樂沒有基本了解，就會像張愛玲所描述的那樣“交響樂的攻勢是慢慢來的……四下里埋伏起來，此起彼應，這樣有計劃的陰謀我害怕”[2]。因此，審美主體如果不具備對審美對象構成要素的先驗基礎，將無法對作品產生審美愉悅。音樂人工智能的實質是機器自主創作音樂作品，其核心是“算法”（Algorithm）。從音樂審美的角度，大致可將機器的算法分為“自律”與“他律”兩種類型：前者是機器嚴格或非嚴格地遵循事先規定好的內部結構原則，對應于音響素材而生成音樂作品，最終的音響呈現受到內部結構原則的自律性限定；另一種類型是機器嚴格或非嚴格地遵循依據人類經驗規定好的外部結構原則，并映射為音響而生成作品，最終的音響呈現受到外部結構原則的他律性限定。當然究其根源，任何算法都是由人類所指定，因此并不存在絕對意義上的“自律”型算法。但是自律性限定的算法一旦啟動即自主執行，而他律性限定的算法則受外部因素的支配與調整。從這個層面來審視，算法程序仍然能夠在某種程度上劃分出“自律”類的人工智能與“他律”類的人工智能。以下將根據這個原則對各種算法作曲進行粗略分類。

一、“自律”類音樂人工智能算法

（一）數學模型（Mathematical Model）

以數學算法與隨機事件構成數學模型進行作曲。其中算法相當于作曲法則，隨機事件相當于音樂元素——音樂中的各種元素可分解為一系列隨機事件，如音的四屬性、音樂三要素等，作曲家（程序員）賦予其不同權重，使用特定隨機算法對其進行運算處理而得出音響序列，其結果是非確定性的。常用的隨機算法有馬爾科夫鏈、高斯分布等。目前以數學模型為主的音樂人工智能作品在伴奏的速度跟隨、樂句的力度處理、終止式的伸縮節奏方面有相當的“智能”感，但是在作品的整體可聽性方面仍有明顯的欠缺。

（二）演化算法（Evolutionary Methods）

演化算法源于達爾文所揭示的生物進化理論，用算法模擬物種進化的過程來構建音樂作品。將隨機或人為的音響事件集合為一個種群，通過選種、遺傳與突變的算法反復迭代，將種群中現有的多個個體進行優勝劣汰，其結果由適應函數構成的審核程序予以矯正，以保證其審美意義的質量。最常見的演化計算方法是遺傳算法（Genetic Algorithms）與遺傳編碼（Genetic Programming）。演化算法試圖將物種進化的過程匹配于音樂生成過程的邏輯不夠完善，因此作品的審美認可度并不高，如今常用于和聲配置與伴奏任務中。

（三）語法系統（Grammars）

音樂的構成法則可類比于人類語言的語法規則。人類語言由字、詞、句等按照一定的語法規則構成表達單元，音樂中的動機、樂節、樂句也具有相似的結構特征。首先創建一個特定音樂作品的語法規則，對和聲、節奏與音高等各種音樂素材進行組合，最后生成音樂作品。誠然，音樂與語言在某種程度上具有同構性，但是比較而言，音樂規則體現出更大的靈活度與可變性，由一個固定的語法規則附加若干可變規則的語言算法，產生出的音樂作品多少帶有生硬而呆板的特征。

二、“他律”類音樂人工智能算法

（一）遷移模型算法（Translational Models）

將非音樂媒體信號源中的信息映射并遷移為音樂音響信息。最常見的是將視覺信息進行轉換，例如將圖像中的線條轉換為旋律，色彩轉換為和聲，色度轉換為力度；將運動物體的空間位移轉換為旋律，速度轉換為節拍節奏等。也可用于非視覺信息的遷移，如將文學作品中的積極/消極的描述，通過自動情感分析系統遷移為大三/小三和弦。實際上，人類的感官在一定程度上的確具有“聯覺”效應，如空間線條與旋律走向的對應，但是如果將其進行嚴格映射，并沒有心理學的有力證據。因此使用遷移模型算法生成的音樂作品，常常出現在交互性的新媒體藝術表演中，更多地以現場的事件相關性與交互性為審美趣味。而一旦音樂作品與其映射對象脫離而單獨呈現，這類作品的可聽性將會大大降低。

（二）知識推論系統（Knowledge-based Systems）

以某種音樂風格類型為知識庫基礎，將該音樂風格的審美特征提取出來并進行編碼，即歸納推理；以編碼程序為算法而創造類似風格的新作品，即演繹推理。例如基于對位法原則的巴洛克音樂風格編碼、基于大小調和聲體系的古典浪漫音樂風格編碼、弱化和聲功能的印象派音樂風格編碼及各個相應風格作品的生成，即屬于知識推論系統算法。這種算法已經在某種程度上接近于音樂學院作曲技術理論的學習過程，生成的音樂作品與其所基于的特定風格知識庫非常相像，具有很高的可聽性。其缺點在于歸納—演繹兩個環節的相對割裂，即風格編碼必須由操作者提供，程序本身僅僅是對編碼的執行運算，作品的結果會嚴重受到操作者對創作規則的抽象理解的影響，并且會存在僵化與雷同的缺點。

（三）機器學習（Machine Learning）

操作者為計算機輸入大量的音樂音響，計算機對其進行有效“聆聽學習”，即運用統計方法對音樂構成的法則進行學習，其過程與知識推論系統相似，但是操作者并不嚴格指定音樂類型，也不為程序提供風格編碼，這個過程由算法程序自動完成，強調其自主性與“無監督”式的學習（unsupervised learning）。當然，從本質上來看，機器學習的“無監督”只能是在一定程度和范圍內，它依然囿于操作者所提供的知識素材庫。機器學習與數學優化、數據挖掘等計算科學的研究成果相關，更與認知科學領域與神經網絡學科的研究成果密切相關，其中最為顯著的是采用決策樹、人工神經網絡、深度學習等方法，是迄今為止對生物學習過程模仿程度最高的一種算法。機器學習仍然屬于仿生，但它超越了對結構與力學層面的仿生，是對人類大腦思維過程的仿生。機器學習既可以用于一般意義上的音樂創作，也可用于即興演奏與競奏等場合。雖然可以生成各種指定風格或混合風格的音樂作品，但是它仍然取決于操作者提供的音樂數據類型，是通過對隨機事件進行概率統計得出規則后的音響預測。

三、算法作曲的論理思考

前文對算法作曲的分類以圖1說明如下。

圖1

必須承認，這里對音樂人工智能算法的理解，是基于一個音樂家的知識結構而形成的；將其歸入“自律”或“他律”的倫理范疇，也是根據這些算法所體現出的顯性特征來進行的。因此，“自律”與“他律”的界限并不是涇渭分明的?？紤]到在實際運用中，這些算法可能會彼此整合，形成一個混合的超級算法模型，以彌補各自的缺點而得到音樂生成的最優化，所以，并不存在絕對的“自律”或“他律”的音樂人工智能算法。實質上，將音樂美學中的“自律論”與“他律論”觀點二元對立化，本身就是對矛盾的割裂與絕對化。并且，隨著量子計算技術、腦科學研究以及信息論、控制論的發展深入，將會出現更多的混合型音樂人工智能的算法模型。

之所以作如上劃分，是想從音樂審美的角度來說明這樣一個觀點：傾向于“自律”型的算法可能會陷入音樂審美的“死胡同”。舉個例子，20世紀初興起的以勛伯格為代表的十二音技法，就是一種強調自律的作曲法則：將十二個半音割裂孤立，追求其絕對的平等，就是否定音樂調性——萬有引力的聯覺作用，就是企圖從底層將人類主觀體驗對音樂構成法則所施加的“他律”作用予以否定。其后的整體序列主義則更是傾盡全力將人類對律動、色彩、力度的主觀先驗基礎從音樂構成法則中徹底地排除，可謂是徹底地“存天理，去人欲”。從這個意義上來看，偶然音樂、噪音音樂等也在美學倫理上屬于“自律”的范疇。毋須多言，歷史已經證明，這類音樂風格早在世紀之交就基本上銷聲匿跡了，主流音樂家依然回到由情感支配、聯覺控制、先驗引導的共識法則的構架體系內進行創作與表演。此外，更不能忽略，這個世界上種類繁多的民間音樂、傳統音樂或原生態音樂，自始至終就沒有被所謂的“自律”倫理約束過。以音樂風格的演變為鑒，在音樂人工智能的生成過程中，完全采用數學模型、演化算法以及語法系統等具有顯著“自律”特征的算法，前途并不樂觀。

這么看來，具備了“他律”特征的算法音樂，似乎有一個暢通的未來，尤其是掌握了深度學習技術的算法，如同媒體鼓吹的那樣有著燦爛輝煌的前景。問題是，以深度學習為代表的算法作曲技術，到底在何種程度上改變了我們現有的音樂觀念、審美趣味乃至我們的音樂生活方式？這個問題仍未得到最終解答，筆者在此試述一二。

如同對“高科技”進行定義一樣，“智能”也是一個邊界模糊的概念。舉兩個簡單的例子：電動磨相對于水動磨，水動磨相對于驢拉磨，驢拉磨相對于人推磨，前者都更具“科技含量”；電算對珠算，珠算對籌算，籌算對結繩記事，前者都更具“智能因素”。但是，就在十年以前，帶有溫控、聲控、光控開關的電器廣告，還動輒冠以“自動”“數字”，甚至是“智能”之名，今天看來，幾近荒唐。誠然，智能有“弱智能”與“強智能”的層級之分，但這個集合的邊界從來就是從歷史這端不斷收束，向著未來那端不斷延展。以智能演奏為例，從19世紀風靡歐洲的八音盒（Musical Box），到20世紀席卷歐美的自動演奏鋼琴（Player Piano），再至21世紀嶄露頭角的音樂機器人（Musical Robot），智能演奏的定義不斷被刷新，所界定的對象也不斷被歷史封存。自動演奏鋼琴比之于八音盒，具有一定“可編程性”（紙帶輸入）與交互性（人力驅動），這就是八音盒在19世紀后期沒落的原因之一?；仡櫚艘艉械陌l展歷程我們會發現，在其最興盛的19世紀中期，制作者大多數都擁有另一個身份——鐘表匠，且國籍多為瑞士或德國。我們可以看出隱藏在其中的寓意：制作精美的八音盒在一定程度上是“醉翁之意不在酒”——它是展示精確、巧妙與完美的機械技術的廣告與炫技品。當自動演奏鋼琴出現后，八音盒的使命基本告終，鐘表匠干回了自己的本行，這就是瑞士鐘表與八音盒的淵源。今天的八音盒已淪為禮品店的玩具，但是人們可能忘記了，正是八音盒的卷軸啟迪了MIDI音序器及其鋼琴卷簾界面。再來回顧一下自動演奏鋼琴的發展歷程：其在取代八音盒后，于20世紀20年代達到發展頂峰，隨即開始急劇衰落——人們不再為鍵盤自動上下翻飛的技術與音響重現而驚嘆，它淪為一個更換曲目繁瑣、維護成本高昂的播放器。留聲機的出現，立刻宣告了它的使命終結。留下的是自動鋼琴的紙帶信息記錄設計，它啟迪了早期計算機指令輸入方式的設計。最后來回顧一下音樂機器人的發展：20世紀80年代初，日本早稻田大學研制出能在音樂會上演奏管風琴的音樂機器人“早稻田2號”（WABOT-2）[3]143-155，它具有人類的外表與結構，以攝像頭為眼，能夠閱讀樂譜，演奏中等難度的樂曲。但是它并沒有在音樂界引起太多轟動，因為在音樂家的眼中，它至多是一個具備人形而高度自動化的播放器而已。豐田汽車公司于2005年與2007年分別推出了類人形小號音樂機器人與小提琴機器人[4]，具備高度仿生的人類外形，且可以進行交互，引起了一時轟動。但值得注意的是，與八音盒的制作產業類似，豐田公司推出小提琴機器人的目的不是研發智能音樂，而是開發陪護與服務機器人（Toyota Partner Robot）以進軍家政市場，演奏樂器僅僅是展示其高超的運動與控制水平，同樣是為了達到廣告效果與眼球效應。從八音盒到自動演奏鋼琴，再到音樂機器人，在音樂家的眼中，其音樂功能的核心只是“自動化”而已，它并沒有撼動我們現有的音樂生活方式。

音樂在很多情況下僅僅是科學技術小試牛刀的領域之一。在功能展示與炫耀上，比音樂獲得的效應更為轟動的著名例子就是棋類競賽。早在1997年AI就已經戰勝了國際象棋特級大師，對陣雙方是IBM的Deep Blue（深藍）與俄羅斯棋手卡斯帕羅夫，后者的落敗引起了世界的震動；2016年3月谷歌的AlphaGo（阿爾法狗，即圍棋機器人）以4比1戰勝韓國職業棋手李世石，之后一鼓作氣以3比0的戰績戰勝了世界排名第一的中國職業棋手柯潔。Deep Blue使用“窮舉法”的硬編碼方案，類似于AI作曲的知識推論算法，而AlphaGo則是基于神經網絡深度學習方法，與AI作曲的機器學習是一類。Deep Blue的勝利曾經給人類帶來了極大的震撼，以至20世紀末又一次出現“顫抖吧，人類”的恐慌（雖然這種恐慌已經出現過多次），很多人預言，國際象棋作為一種競技體育項目將從此消失。但事實恰恰相反，20多年過去了，國際象棋愛好者的人數不降反升。20年后AlphaGo的勝利并沒有引起之前的恐慌，更沒有人為圍棋項目的未來而悲觀，反而如今越來越多的棋手使用算法程序來輔助訓練。尤為值得注意的是，2017年5月，阿爾法圍棋團隊宣布他們將不再參加任何圍棋比賽。這個聲明再次向我們證實了AI在音樂領域“醉翁之意不在酒”的意圖。

音樂是人類迄今為止難以完全解釋與定義的事物之一。對于音樂的起源，無論是勞動說、模仿說、語言說、求偶說等等，都難以準確地解釋它為何發生；對于音樂的功能，無論是社會說、審美說、認知說、教化說與娛樂說，也無法將其在人類社會所扮演的角色圓滿解讀。用發生學的邏輯來看，無法對音樂的起源與功能進行清晰描述，就無法為音樂人工智能的未來進行準確預測。音樂絕不僅僅是音響的組合所帶來的聽覺體驗，它更多聯系于人的情感記憶與偏好，它能夠喚醒我們一種被稱之為“情懷”的感知。音樂不僅僅是引起顫抖、雞皮疙瘩（gooseflesh effect）與多巴胺分泌的外部刺激，因為吸煙酗酒也會產生同樣的生理反應；音樂不僅僅是學習語言的預備，因為大量的失歌癥患者并不存在語言的障礙；音樂更不僅僅為了求偶，這一點所有的音樂家與音樂愛好者都會同意，即使大家承認它有點作用；音樂不僅僅是更快、更高、更準的競賽式炫技，所以從這個角度上而言，所有的音樂機器人演奏，都只是暫時的眼球效應，在新奇感消逝之后，它與博物館收藏的自鳴鐘并無質的區別。

“莫拉維克悖論”如此表達：電腦很容易達到成人博弈的水平，但是讓它具備幼兒基本的感知和行動能力相當困難。實際上，人工智能最根本的存在意義是顛覆我們對“智慧”的傳統定義——我們之前理所當然地將符號認知與整合、規律總結與提取、定理演算與證明等能力劃定為“智慧”，而將直覺、下意識等行為視為生物本能性的刺激反應。人工智能的出現，促使人類重新劃分“人工”與“天然”、“智能”與“機械”的邊界，這個最終答案可能是顛覆性的。反過來說，現有的人工智能，以其每秒數億次的邏輯運算能力與人類對弈競爭，值得驚嘆的恰恰是人類的智慧。人類除了下棋，還擁有自由意志與行動能力，為理想奮斗以及思考人生等目標，而算法只有一種存在的前提——通電，只有一種使命——替代人類執行枯燥的技術工作。因此，人工智能讓我們重新定義藝術與技術的邊界，促使我們不斷提高藝術創作的智慧含量與人性品質，這就是音樂人工智能存在并發展的意義。

（本文根據筆者在“2018音樂人工智能發展研討會”上的主題發言整理而成。）

猜你喜歡

八音盒自律人工智能

我的八音盒

作文小學高年級(2022年5期)2022-06-16

只有自律，才能活出自己想要的人生！

新世紀智能(英語備考)(2020年6期)2020-08-14

能自律者為俊杰

文苑(2020年7期)2020-08-12

我的心愛之物

學生導報·東方少年(2019年19期)2019-11-27

自律成就美好

海峽姐妹(2019年10期)2019-11-23

小天使·六年級語數英綜合(2019年9期)2019-11-09

2019：人工智能

商界(2019年12期)2019-01-03

人工智能與就業

IT經理世界(2018年20期)2018-10-24

數讀人工智能

小康(2017年16期)2017-06-07

下一幕，人工智能！

南風窗(2016年19期)2016-09-21

藝術探索2018年5期

藝術探索的其它文章: 分流與失道：從后結構符號學論清代山水畫的衰落; 從唐代“金筐寶鈿”論花絲鑲嵌的歷史和定義; 問梅哪得香如故：“梅景書屋”在“文革”后的首次畫展鉤沉; 忠于藝術：社會美育視角下的藝苑繪畫研究所; 從佛的三十二相看造像技術、教派之爭與佛教美學的建立; 宗教藝術的定義、性質、邊界及基本形態初論

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合