黃曾陽研究員ppt語言超人之夢.ppt

(52頁)

'黃曾陽研究員ppt語言超人之夢.ppt'
語言超人之夢黃曾陽 (中科院聲學所 HNC實驗室)2006年8月23日目錄 1 網絡世界需要語言超人2從語言超人反思圖靈檢驗3語言超人基因之夢4 一個語言超人基因的介紹5一個句群的考察6一絲曙光的體驗1 網絡世界需要語言超人 后工業時代正在出現與傳統世界并存的 另一種世界,那就是網絡世界。這已經是一個活生生的存在,是人類社會前所未有的一個特殊存在。這個特殊存在會引發新的哲學課題么? 會。但問題究竟是什么 還沒有凝聚出來。 網絡世界與傳統世界的比較 傳統世界 網絡世界 亞當和夏娃出生接近“萬歲” 尚未出生政治、經濟、文化的分野十分清晰 一片模糊導演與演員有明確分工 沒有這種分工有序 無序后工業時代 史前時代(政治舞臺的導演是政治家和軍事家,經濟舞臺的導演是企業家,文化舞臺的導演主要是哲學家)網絡世界怎樣才能從無序狀態進入有序狀態 即脫離史前時代呢?關鍵在網絡人的誕生。這里的網絡人不是指當前意義下的網民,而是指那些能夠理解自然語言、只在網上生存、無肉體而能思維的網絡人。網絡人的誕生將徹底改變網絡世界的面貌,使網絡世界脫離“史前”時代。沒有網絡人的誕生,網絡世界就不可能脫離“史前”時代,脫離“史前”時代的網絡世界才會大放異彩,使傳統世界發生無愧于后工業時代的巨大變化, 如同工業時代之如農業時代。 網絡人的基本特征記憶力超人——“一目千行,過目不忘”(張松和黃蓉的媽媽算什么?) 故名之語言超人 中國人的智力描述 記憶力 “一目十行,過目不忘”敏捷力 “七步成詩”、“眉頭一蹙,計上心來”領悟力 “舉一反三”、“明察秋毫”、“憤啟悱發”,判斷力 “神機妙算”“料事如神”“錦囊妙計”行動力 “勢如破竹”、“以柔克剛”、“四兩撥千斤” (想象力、創造力) 中國人對五力表現情有獨鐘 章太炎先生曾依據“五力”標準而評定其門生中的五王 天王 黃侃(季剛)(1886-1935) 東王 汪東(旭初)(1890-1963) 西王 朱希祖(逖先)(1879-1944) 南王 錢玄同(翼王)(1887-1939) 北王 吳承士(檢齋)(1884-1939)網絡人的記憶力確實可畏,其敏捷力也許可驚,但其領悟力、判斷力、行動力、想象力、創造力肯定可控因此不必擔心:這種“一目千行,過目不忘”語言超人會起來造反。在西方 確實有人擔心網絡世界的這種潛在性災難,萬一這些網絡人偷食了那伊甸園里善惡樹上的果子 怎么辦呢?那網絡世界豈不是要重演《圣經》里的災難故事了么?因此 他們試圖抵制甚至扼殺網絡亞當和夏娃的誕生。擔心者們既不了解智能科學和技術的本性,也不了解 即使真的出現了網絡人,屆時向網絡社會注入文明基因并不難辦到。因此 擔心者的擔心是多余的,我們可以放心地去從事語言超人的探索。2從語言超人反思圖靈檢驗 計算機的原創者原創過人工智能的偉大構思,提出過人工智能的智能標準,那就是著名的圖靈檢驗。圖靈檢驗:檢驗者向一間黑屋子的兩個對象 分別以書面語方式進行盤問, 檢驗者知道 其中一個對象不是人而是機器人, 檢驗目的在于確定誰是誰。如果檢驗者在經過充分盤問后仍不能確定誰是誰,則該機器人就是具有人工智能的機器人。圖靈先生是偉大的天才,但圖靈檢驗的設計卻過于天才了!表面上 問題出在圖靈先生對盤問內容的限定不當。(該限定的重點放在掩飾人的弱點,而不考慮掩飾機器人的弱點,這實際上就是對機器人提出了過高的智能要求。)實質上 問題出在圖靈先生對人工智能的科學探索方向還來不及深思熟慮, 就英年早逝(1912-1954)了。但是 圖靈先生的崇拜者實在是太多了,自然語言理解的探索就存在著圖靈檢驗的鮮明烙印,著名的CYC計劃就是明證。自然語言理解的悲觀論實質上大都采用了圖靈檢驗標準,盡管某些悲觀論者或許不知道圖靈其人。智能是概念空間的全方位表現,上一講里談到概念空間的五大坂塊,圖靈檢驗基本上是對五大坂塊綜合智能的全面模擬,這肯定不是本世紀的課題,更遑論上個世紀了。但是 這并不是說 我們應該拋棄圖靈檢驗,相反 應該深入領會圖靈檢驗的啟示意義。黑屋子和兩個盤問對象只是形式,重要的是盤問本身。盤問是一門學問,這才是圖靈檢驗的本質。也許只有現代心理學家做到了對圖靈檢驗的心領神會和科學運用,而計算機學界、特別計算語言學界反而忽視了。你去盤問“太平洋和青蛙誰大”有什么意義?去盤問“咬死了獵人的狗”是什么歧義結構又有多少意義?盤問的第一號學問是 盤問使用的語言單位,第二號是 盤問使用的文本形式,第三號是 盤問的內容。什么語言單位是合適的、科學的盤問單位?字或詞語?短語或小句?句子或段落?篇章?什么語言文本是合適的、科學的盤問文本?童話和詩歌?《紅樓夢》或《三國演義》?魯迅的雜文或朱自清的散文?……什么內容是盤問的“大場”與“急所”(將簡稱“大急”)?盤問的合適語言單位是句群,盤問的合適語言文本是媒體信息,盤問內容的“大急”是領域、情景和背景。 為什么? 因為:第一 句群與語境單元對應(明晰性)。第二 媒體信息是最廣大受眾能夠理解的信息(可行性),(其信息表述方式已經考慮了受眾的理解力, 消解了需要專家知識才能理解的專業表達方式, 比較適合語言超人的知識狀態。)第三 語境單元存在世界知識的先驗知識框架(科學性), 這一知識框架可以事先存入語言超人之腦。第四 經過語境單元萃取以后 語境單元框架里已經填入了領域、情景和背景的具體知識。(可操作性)第五 理解力的集中體現(“大急”性)一個具體句群里面包含的領域、情景和背景知識經常是不完備的,但語境單元框架可以給出這種不完備性的提示,對這一提示的運用能力是語言超人理解力的根本標志,這一提示運用力可以量化么?語言超人可以通過盤問過程進行學習而得到提高么?這一點 這關鍵性的一點 這需要中華文明的特殊智慧才能看明白的一點(馮友蘭先生的觀點)已經出現了曙光么?3語言超人的基因之夢 語言超人必須看作是一種特殊的生命形態,生命需要基因。語境單元就是語言超人的基因。語境單元萃取SGU就是培育這個基因。語言超人之夢的征程要從語言超人的基因之夢起步。我們都十分熟悉生命的多樣性,沒有生命的多樣性就沒有生命,生命的多樣性來源于基因的多樣性,語言超人當然也具有基因多樣性。這里說的語言超人基因當然只涉及理解基因,而且是指理解基因的團塊,也可稱語言超人的胚胎,簡稱語言超人基因。那么 語言超人基因的“多”對應著語境概念樹的226么?不是!因為 語境單元不是對應于概。省略部分。不對稱,官方具有對民方進行管理的權力,而民方不具有對官方進行管理的權力。官民關系的這一基本特征與制度無關,符號本身a123e2m3并未給出對這一不對稱性的描述,而體現在下面的概念關聯式里:a123e213::=(a12a,l10,rc30ara123e223;l01,a119) (民政定義為政府對民間事務的管理)a123e2m3:=(~(jruj719),l0144e61,40\12e21) (民務具有不對稱性,主宰者是官方)a123e2m3=a12im ?。駝张c治國基本方式的獎勵、懲罰與規范強交式關聯)a123e2m3=a527 (民務與法治的民眾側面強交式關聯)5一個句群實例的考察 {社會力量|設立|}||, [-應當]在科學技術行政部門||辦理登記手續。 具體辦法||由國務院科學技術行政部門||規定。 <社會力量|~經登記~|設立|的>,||~在獎勵活動中~||不得收取||任何費用。  SG-C=!111T0aY8022*21J#T0C={XY10*22J} +&%!112D01X4*22J++f44T19Ya0*21J&Cn#TA=The establishment of society-oriented science and technology prizes by social non- governmental sectors|| shall be through registration procedures|| with administrative departments of science and technology. +&%The specific measures|| are to be formulated ||by the administrative department of science and technology of the State Council.++{Non-governmental sectors| establishing| society-oriented science and technology prizes|~ upon registration}|| shall not charge ||any fees||~ in prizeing activities.SG-E= T0aY8022*21J+&%!027D01X4*22J++f44T19Yb0*21JCn#TA={!0pXY10*22JWy} 漢語 英語!111T0aY8022*21J =>!0#T0C={XY10*22J} MLC+&%!112D01X4*22J =>+&%!027D01X4*22J++f44T19Yb0*21J&Cn =>++f44T19Yb0*21JCn #TA= =>#TA={XY10*22Jwy} 本句群的突出難點逗號之難(逗號多功能難點,10號難點) “在”字之難(主輔變換難點,9號難點) “獎”與“收取”的不相容之難(復雜省略難點,15號難點)本句群由5個語段構成,第一語段是小句么?{社會力量|設立|},第二語段里的省略容易判定和恢復么?其中的“在科學技術行政部門”是輔塊么? ([-應當]在科學技術行政部門||辦理登記手續。) 第三語段里的省略容易判定和恢復么?(具體辦法||由國務院科學技術行政部門||規定。) 第四語段是小句么? (<社會力量|~經登記~|設立|的>,) 第五語段里的省略容易判定和恢復么? (||~在獎勵活動中~||不得收取||任何費用。)6 一絲曙光的體驗 1 第二語段的“科學技術行政部門”與“辦理登記手續”同時出現, 這足以引發民務語境單元的聯想, 基于該語境單元的先驗知識官方還需要進一步確認,民方要找出“證據”。2 前者得到第三語段的“國務院科學技術行政部門”的進一步確認3 后者得到第一語段里的“社會力量”的印證。4 于是 語境單元得以認定。SCD= Re+T0A+T01Y802+T0C+ Y802B15 運用語境單元的先驗知識語言超人可以認定 第一語段是對T0A和T0C的映射, 第二語段里的“科學技術行政部門”是對Y802B1的映射,“辦理登記手續”是對T01Y802的映射, 第四和第五語段組合起來是對Re的映射。6 在上述認定的基礎上,語言超人有希望給出上面的HNC標注, 這意味著句類分析的20項難點可以通過句群分析SGU得到比較徹底的解決。 SCD= Re+T0A+T01Y802+T0C+ Y802B17 語言超人還可以認定 第一語段是著名的花園幽徑句(屬于HNC的原型句蛻),第二語段的不定特指“具體辦法”是指T0C-T01Y802的“具體辦法”, 第二語段的“在科學技術行政部門”不是輔塊,而是主塊Y802B1。8 語言超人有希望懂得 “向”是“在”的合適替代符號。 ([-應當]在科學技術行政部門||辦理登記手續。)9 語言超人還有希望懂得 第四和第五語段的英語翻譯并不妥當,漢語的模糊表達方式是否優于英語非模糊表達方式?(未指定費用收取者,指定Non-governmental sectors為收取者)10 上列5-9項應成為盤問的要點, 并通過這種盤問方式創立一個適合于語言超人培育的圖靈檢驗。以上所說 是一絲曙光還是一段神話?如果你的神話感大于曙光感,那是我的表達失誤,很對不起。但不論是哪種感覺 都是最美的存在,因為她們都屬于探索之夢。讓最美的存在永遠與我們同在。謝謝!附:句類分析的20項難點(上)01 特征語義塊EK多句類代碼的選定02 全局語句(簡記為EgJ)與局部//蛻化語句(簡稱句蛻,簡記為ElJ)的判定(多動詞難點)03 含LS語句與復句的判定04 廣義對象語義塊多元邏輯組合的分析05 Ek//EK復合構成與分離的分析06 以指代和句間接應詞語為代表的淺層隱知識揭示07 無EK語句的句類辨認08 廣義對象語義塊GBK分離現象的分析09 逗號功能的判定附:句類分析的20項難點(下)10語義塊主輔變換的分析11句類轉換的分析12特殊塊擴的辨認13復雜因果句的識別14體詞多義的選定15 以復雜省略和想象描述為代表的深層隱知識揭示16 語句違例格式的判定(漢語多見,下同)17 動詞體詞化的識別18 動態組合詞的識別與語義認定19 分詞消歧20 偽詞鑒偽(漢語特有)
關 鍵 詞:
語言 之夢 超人 ppt 研究員
 天天文庫所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
關于本文
本文標題:黃曾陽研究員ppt語言超人之夢.ppt
鏈接地址: http://www.476824.live/p-51616945.html
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服點擊這里,給天天文庫發消息,QQ:1290478887 - 聯系我們

本站為“文檔C2C交易模式”,即用戶上傳的文檔直接賣給(下載)用戶,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有【成交的100%(原創)】。本站是網絡服務平臺方,若您的權利被侵害,侵權客服QQ:1290478887 歡迎舉報。

[email protected] 2017-2027 http://www.476824.live 網站版權所有

粵ICP備19057495號 

收起
展開
球探网即时蓝球比分 几种简单的理财方法 pc蛋蛋看走势图的方法 福建省体彩22选5开奖今天 江西多乐彩任三遗漏 福彩快乐10分技巧 京新药业股票吧 幸运农场安卓版下载 上海11选5任五遗漏号 中泰化学股票分析 湖北十一选五任选基本走势图