世界首款人工智能 DAW 軟件 WavTool
人工智能在 2023 年蓬勃發(fā)展。公眾的大部分注意力都集中在ChatGPT、Dalle-2 和 Midjourney等文本和圖像生成領(lǐng)域。 除了這些知名應用之外,還有數(shù)百個鮮為人知的AI工具可以完成從寫代碼、網(wǎng)站分析到創(chuàng)作AI音樂的各項任務(wù)。
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=pcPNeWUE9g0
WavTool(https://wavtool.com/)是市場上第一個文字輸入AI輔助的DAW。它內(nèi)含一個AI聊天助手,可以在工作站中幫你完成編寫midi、生成樂器、控制效果器以及其他DAW控制功能。這個AI DAW并不是憑空出現(xiàn)的。上月Neutone(https://neutone.space/)發(fā)布,這是一個DDSP 和 RAVE2等人工智能算法運行的平臺插件。Google的Magenta團隊也提供了一系列 AI 音樂插件(https://www.midifan.com/modulenews-detailview-32199.htm?fromM=1)。有傳言說聲音設(shè)計工具Audio Design Desk(http://add.app/)即將推出AI功能。截止目前,WavTool 是唯一具有由GPT-4提供支持的作曲家助手的AI DAW。
ChatGPT可以生成和弦進行和旋律,但僅限于文本格式。WavTool則能使用GPT-4生成DAW可以執(zhí)行的命令,包括從編寫midi到波表合成。WavTool的聊天助手Conductor已經(jīng)實現(xiàn)了生成midi音符、創(chuàng)建新的樂器音軌、配置側(cè)鏈壓縮等等功能。最棒的是,如果人工智能做得不好,你可以問它為什么做出這些決定。了解其思維過程后,你可以提供有關(guān)如何改進和實現(xiàn)其目標的建議,通過提示詞微調(diào)來達成目標。
WavTool簡介
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=UT9wY-Poj-Y
WavTool是一款由AI驅(qū)動的在線DAW。 沒錯,你不必下載就可以通過Google或Facebook一鍵注冊。免費版提供的AI對話輪次有限。 在發(fā)稿時,完全版WavTool收費為每月20美元。WavTool包括一個可以隨意顯示和隱藏的嵌入式AI聊天機器人。這個名為Conductor的聊天機器人對音樂理論和音頻制作知識掌握扎實,可以理解你的想法并嘗試在DAW中實現(xiàn)。用戶可以通過聊天機器人進行對話在歌曲片段上進行協(xié)作、生成或修改MIDI內(nèi)容以及配置插件添加效果器。
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=W_9hz9MInbM
五大特色功能
- AI Conductor:WavTool將他們的AI聊天機器人稱 Conductor,因為它能夠指導您完成音樂制作。 它可以觸及DAW的每個組件,就音樂與你進行深入交流并生成音符。
- 瀏覽器運行:你不需要在計算機上本地安裝WavTool,因為它可以瀏覽器中直接使用。當前有一些bug,我們在后面會討論。
- 自定義波表合成器:為你的midi軌道引入WavTool的樂器預設(shè)或從頭開始構(gòu)建自定義波表音色。 上面的視頻詳細介紹了用戶如何制作新的樂器。
- 設(shè)備面板:WavTool 的面板可讓您設(shè)置控制均衡、混響、延遲、動態(tài)、失真、LFO、側(cè)鏈壓縮和頻譜儀等的設(shè)備。 與 Ableton Live Max/MSP不同,聊天機器人Conductor可以根據(jù)文本提示創(chuàng)建和編輯設(shè)備鏈。
- 電腦鍵盤和外接鍵盤:WavTool的鋼琴卷簾包括一個鍵盤界面,可以顯示你正在演奏的音符。 您可以在電腦鍵盤上直接演奏或使用常見的MIDI控制器。
使用WavTool做個beat有多快?
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=Cvl30rn03Hg
當您在 WavTool 中啟動一個新項目時,聊天機器人Conductor會以極其簡單的音樂表達提供靈感,例如基于大調(diào)音階的8分音符。剛開始的體驗可能會讓一些人認為該工具毫無用處,但這不是WavTool的全貌。雖然WavTool短時間只能做出平庸的beats,但如果花30分鐘通過后續(xù)對話命令完善提示,你可以引導聊天機器人更接近你想要表達的音樂。正如開發(fā)人員的介紹(https://wavtool.com/faq),WavTool 還有很長的路要走,他們每天都在努力讓它變得更好。稍后,我將分享一些對話提示詞,你可以使用這些提示詞使Wavtool創(chuàng)作過程朝著正確的方向發(fā)展。 但首先,請思考一下是什么讓這個工具如此具有革命性,即使在AI音樂軟件領(lǐng)域。
聊天機器人Conductor:AI音樂作曲家
WavTool的AI音樂作曲家Conductor利用GPT-4與你就任何音樂主題進行深入而細致的對話。但它真正的天賦是能夠根據(jù) GPT的命令在 DAW 中采取行動實現(xiàn)需求。這種文本到音樂的功能是前所未見的。
讓WavTool 優(yōu)于Musenet的秘密武器
聊天機器人Conductor讓人非常令人興奮,因為它使AI DAW有別于其他主要的AI音樂生成工具。 與Google和OpenAI的音樂創(chuàng)作工具不同,WavTool知道為什么它以特定方式生成音樂并向您詳細解釋其推理過程,只要你問它。
以前的音樂生成工具不能進行對話或接受文本命令,這意味著我們永遠不知道為什么AI會生成特定的旋律或和弦進行。除了請求更改之外,我們無法對其選擇進行評價和微調(diào)。WavTool的AI Conductor可讓您直接訪問AI音樂作曲家的思想。為什么它會創(chuàng)造出那種糟糕的和弦進行或如此簡單的旋律? 事實證明,即使是糟糕的AI音樂作品背后似乎也有一些潛在的邏輯�,F(xiàn)在我們可以更深入地了解AI音樂模型的思想,與它像人類一樣合作并指導它的方向。
使用文本到音樂提示微調(diào)AI
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=2zg3V66-Fzs
如果您最近一直在探索生成式 AI 工具,您可能聽說過人們提示詞工程師。 有公司以超過30 萬美元的年薪雇用這些“工程師”。
提示詞工程師的主要目標是為文本輸入的人工智能工具選擇正確的提示詞,以獲取公司期望的結(jié)果。作為WavTool用戶,你無需成為出色的作家或提示詞工程師即可開始使用。 盡管如此,你所使用的語言表達將決定其創(chuàng)作的質(zhì)量和你的使用體驗。
人們會出售AI音樂提示詞嗎?
提示詞工程不僅是一份高收入工作。人們在PromptBase(https://promptbase.com/)等網(wǎng)站上銷售AI提示詞。 該站點已經(jīng)有一個音樂類別和一小部分用于ChatGPT 的文本提示。 在我看來,像這樣提示詞銷售感覺就像是Web3和音樂NFT場景。我沒有在提示詞交易網(wǎng)站上購買或出售任何東西,但我認為這是一個有趣的想法。 作為賣家,他們要求強制的支付工具集成和你的社安號,所以我沒有入駐。 此外,作為一個喜歡寫提示詞的人,我并不熱衷于從別人那里購買。根據(jù)我的經(jīng)驗,WavTool需要的不僅僅是提示詞。 它需要一整套模式和策略。 專業(yè)用戶可以提取出所有他最了解的術(shù)語和表達方式,以創(chuàng)建某種字典來使用。
WavTool中生成音樂的4個提示詞序列
WavTool支持與DAW中的任何操作相關(guān)的提示詞。 這個提示詞序列旨在幫助WavTool專注于音樂創(chuàng)作。這里有四個AI提示詞,您可以按順序使用它們來開始深入研究。 用您自己的話替換插入符 <> 中的文本。
提示 #1:“Are you familiar with<流派、藝術(shù)家或歌曲>?”
提示 #2:“Id like you to create a<你想要的描述>。Before you start generating it, please name 5 defining features of <你的音樂選擇> that you could emulate with a MIDI track here in WavTool?“
提示 #3:"Okay, generate it on three instrument tracks."
提示 #4:"Generate a new variation with <你想要的變化幅度>. "最后一個提示可以重復使用來微調(diào)midi輸出。根據(jù)我的經(jīng)驗,需要5-10 次迭代來獲得一個比較長且可用的音樂內(nèi)容。
使用一段時間后,你會發(fā)現(xiàn)AI能幫助你,但也有一些缺點。 它有知識,但在任務(wù)執(zhí)行上笨手笨腳,無法完成它打算做的所有事情。我最好的建議是要有耐心,并引導它達到你想要的結(jié)果。 挑戰(zhàn)自己,找到更好的方法來盡可能準確地描述您想要的東西。您可能需要給出更明確的技術(shù)命令,例如“將鋼琴和弦向上移動兩個八度”或“使用四分音符、八分音符和十六分音符的組合”。當然,你可以隨時放棄,自己動手操作DAW。音樂詞匯表(https://viva.pressbooks.pub/openmusictheory/back-matter/glossary/)以及免費的音樂理論課程(https://www.musictheory.net/lessons)可以拓展你的詞匯量。 AI對音樂理論概念有非常深入的了解。
使用WavTool時遇到的問題
WavTool 代表著一項了不起的成就。 這是同類產(chǎn)品中的第一個AI DAW,當您意識到它是獨立開發(fā)時會更加令人印象深刻。也就是說,DAW有一些需要解決的bug。
- AI說一套做一套。 對話中AI可能會說它將創(chuàng)建一個帶有和弦和旋律的MIDI文件,但事實上只生成了旋律。 它有可能會在單獨的軌道上創(chuàng)建一個和弦進行,但調(diào)又是錯誤的。 這種不一致確實會花費一些時間并影響工作效率,除非你準備好收拾殘局并自己更正。
- AI只完成一部分它承諾的事。 如果你提出太多要求,AI似乎會超載。 OpenAI的ChatGPT在面對音樂提示是有同樣的問題。 要有耐心,一次一步地要求改進,以獲得最佳結(jié)果。
- 如果請求太復雜,對話機器人將超時。 對話機器人的使用限制還不清楚,所以如果它一直超時,請縮減句子的長度。
- 對話機器人的按鈕有時會失靈。 我注意到如果按鈕是為后來被刪除的樂器創(chuàng)建的,就會發(fā)生這種情況。 但有時它會無緣無故地失效。
- 鋼琴卷簾的MIDI音符很難在上下拖動。 解決方法是選擇音符并并使用鍵盤箭頭來移動。
所有這些錯誤都能最終解決,所以主要的問題是時間效率。 我們期待GPT的對話速度提升和以及音樂生成質(zhì)量的升級。AI作曲現(xiàn)在速度緩慢使它不如我自己創(chuàng)作。 當另一方面,文本到音樂的提示系統(tǒng)非常新穎,我真的不在乎它有多慢。 至少就目前而言,玩起來很有趣,我相信隨著技術(shù)的成熟,這些問題會隨著時間的推移而得到改善。
WavTool創(chuàng)始人專訪
原 YouTube 視頻鏈接:
https://www.youtube.com/watch?v=JAA4z7m-WZw
創(chuàng)始人Sam Watkinson可以在WavTool Discord頻道上聯(lián)系到,他非常友好地接受了采訪。
記者:感謝您接受快速對話! 你能和我們的讀者分享一下你在音樂制作和軟件開發(fā)方面的背景嗎?
Sam Watkinson:我在高中開始制作音樂,然后上大學學習音樂制作和音頻工程。 畢業(yè)后,我自學了編程,這樣我就可以幫助我的一些朋友創(chuàng)業(yè)。 之后編程變成了職業(yè),音樂成為了的副業(yè)。我多年來一直在做配樂項目和原創(chuàng)音樂。 讓我印象深刻的是,每個人,甚至是專業(yè)音樂人,在第一次接觸 DAW 時都非常吃力。 我有很多朋友來找我學習制作,每次我都親眼看到這種掙扎。 音樂制作是我生活中非常重要的一部分。 創(chuàng)作和DJ幫助我真正發(fā)現(xiàn)了自我并在高中時樹立了個人信心。我有技術(shù)頭腦和空閑時間,所以學習DAW對我來說很有趣。 但是很多才華橫溢的音樂人并不具備這樣的能力。我相信技術(shù)的力量可以幫助他們在音樂制作中找到快樂和意義。
記者:那么是什么驅(qū)使你走得更遠去開發(fā)自己的DAW?
Sam Watkinson:幾年前,我開始試驗我所熟悉的網(wǎng)頁開發(fā),看看是否有可能構(gòu)建滿足DAW核心技術(shù)要求,包括信號路由、實時第三方效果器等。去年年底,我工作的初創(chuàng)公司受到經(jīng)濟衰退的打擊,我發(fā)現(xiàn)自己失業(yè)了。 從那時起,我就全職從事這DAW開發(fā)方面的工作,在今年2月,我邀請前同事Keith作為聯(lián)合創(chuàng)始人加入。 他的背景很相似,也是一名訓練有素的制作人,從事軟件工作的時間差不多一樣長,而且還專注于創(chuàng)業(yè)并用技術(shù)支持創(chuàng)意產(chǎn)業(yè)的發(fā)展。
記者:您使用 GPT-4 的經(jīng)歷如何?
Sam Watkinson:GPT-4的集成是我們朝著降低音樂制作準入門檻邁出的第一步。 我們收到了很多反饋——正面的、負面的,以及介于兩者之間的所有反饋——我們在前進的過程中非常認真地對待所有這些。 我們可能即將進入一個充滿人工智能內(nèi)容的未來,而我們與WavTool的使命是盡我們所能幫助人類創(chuàng)造力蓬勃發(fā)展。
結(jié)語,展望
我們正在見證一種全新的DAW誕生。今天使用的文本聊天很容易被語音輸入所取代, 我們將與DAW交談并描述我們的需求。 AI DAW將使用文本語音轉(zhuǎn)換技術(shù)以自己的語音來回答。 聽起來有點荒謬,但我認為我們可能比預期的更接近這項技術(shù)的實現(xiàn)。在這個新的環(huán)境下,我們的音樂詞匯將是一種資產(chǎn)。 專業(yè)作曲家可能會因此獲得競爭優(yōu)勢。
如果這些AI DAW變得足夠先進,旋律生成工具和和弦進行軟件也可能會受到?jīng)_擊。 當你的AI音樂作曲家可以完成時,為什么要花錢購買隨機音符生成器呢?話雖如此,GPT-4在真正對音樂生成軟件構(gòu)成威脅之前還有一些路要走。 音樂制作人還會依附于他們現(xiàn)有的 DAW和工作方式。 GPT 的音樂質(zhì)量也需要變得更好才能登上舞臺。
| 【打印此頁】【返回首頁】 |
