數位時代的「文化主權」:
紐西蘭毛利人如何透過 AI 重建語言未來
作者:蔡孟均
語言不僅是溝通的工具,也是文化、記憶與感受的重要載體。例如台語中的「罩雺」(Tà-bông),不只是霧,還有「氤氳」或「迷濛」難以描述,一種被水氣包圍,失去方向與陷在其中的壓力感受。又如賽德克語「Btunux」與布農語「batu」,都能與南島語「*batux」(石頭)建立跨越時間與地理的文化連結。
聯合國預測,到 2050 年,全球將有一半語言滅絕。當語言消亡時,連帶整個文化體系,包括歷史、智慧與民族靈魂也會一併消逝。在這樣的背景下,紐西蘭毛利人採取了一項不同的行動。
在 iPRES 國際數位保存研討會中,來自紐西蘭的毛利部落廣播電台(Te Hiku Media)執行長 Peter Lucas Jones 分享,他們不僅將數位線上平台建立成空中的會堂,並透過人工智慧,將語言保存轉化為「文化主權」的實踐,成功開發出領先全球的原住民語言自動語音辨識模型(ASR)。
Te Hiku Media 是紐西蘭 21 個部落廣播電台之一。在過去 30 年間持續以毛利語製作節目,內容包括長者訪談,社群故事、新聞與資訊,。並記錄大量知識、傳統實務、文化儀式與重點活動。可以說是一座用聲音保存的文化資料庫。然而,這些資料多存於類比磁帶之中,正逐漸劣化與逝去。
2013 年時,電台召開一場關鍵的部落會議。為了確保決議符合文化正當性,他們採取反向操作,宣布「不邀請」一般大眾,僅限 65 歲以上的毛利語母語者參加。會中通過了三項決議: 1. 確立振興與復甦毛利語言的願景。 2. 授權並要求團隊以文化正確的方式數位化部落檔案。 3. 建立管道讓移居各地的族人與新世代,得以存取祖先的聲音,並重新建立連結。
語言與資料的處理權,源自社群本身,而非外部機構。 在語料建置初期,團隊曾經試圖透過商業 AI 工具,但是商業模型無法理解語境與多重涵意,將「孩子們」(Tamariki mā)錯誤翻譯為「做個白人小孩」。這反映出,語言若直接交給外部系統處理,反而會侵蝕和損害本土語言。促使團隊決定自己建立模型。 團隊投入電台累積的 310 小時錄音藏品,並邀請族人朗讀 19 世紀的毛利語報紙文本,以快速擴充語音資料。並由熟悉語言與文化的母語者進行標註與發音校正,以確保語料的準確與符合文化脈絡。最終,他們成功建立高準確度的語音辨識模型,並進一步發展發音學習與語音合成工具,使語言不只被保存,也能被學習與使用。
該團隊也重視「Data is land」(資料即土地)的概念。這些資料承載原住民的文化記憶。如同土地一樣,具有歸屬與邊界,不可任意侵犯。因此,他們拒絕將資料完全開放,而是建立「守護授權機制」( Kaitiakitanga License)。依據文化敏感性分層管理資料使用,並限制監控、歧視或不當商業用途,以避免數位時代出現新的文化剝削。 在硬體方面,也選擇在凱塔亞(Kaitāia)當地設置實體 GPU 進行運算,並結合地熱與太陽能,讓技術基礎設施本身也回到在地社群。 完成模型後,團隊並未止步,而是將技術延伸至太平洋其他南島語言,例如與夏威夷 Kanaka Maoli 社群合作,透過模型微調與遷移學習,協助建立語音系統,展現語系間共享資源的可能性。
台灣作為南島語系的發源地,擁有高度多樣性,卻同樣面臨語言流失危機。即使是相對強勢的閩客語,也在「現代化」過程中逐漸失去原有的文化厚度。台灣具備成熟的科技產業與人才基礎,但這些技術,是否能協助建立屬於自己的文化主權,還是成為另一種文化殖民呢?而影音資料典藏單位在這之中又能扮演什麼樣的角色?毛利人的經驗告訴我們,只有當語言、資料與決策權掌握在社群手中,才可能在數位時代繼續維持文化主權。

參考資料
- [1]https://kaituhi.nz/ :該專案開放使用,為毛利語與紐西蘭英語設計的 AI 語音轉文字平台。


