• <strike id="aymay"></strike>
    <strike id="aymay"></strike>
    <ul id="aymay"><dfn id="aymay"></dfn></ul>
    <ul id="aymay"><sup id="aymay"></sup></ul>
  • <del id="aymay"></del>

    谷歌娘新技能:谷歌將語言變成向量空間

    2013-10-14 21:22 來源:電子信息網 作者:和靜

    機器翻譯(簡稱“機譯”)一直是科技領域的一大難題。目前基于統計機譯方法的在線工具如谷歌翻譯、必應翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其翻譯結果勉強可用,但離完美還相去甚遠。

    為提高在線翻譯質量,美國谷歌(Google)公司的三名工程師最近提出一種嶄新的機譯方法:將語言翻譯變成向量空間數學問題,利用數據挖掘技術建模一種語言的結構,然后與另一種語言的結構進行對比,從而擴充和完善現有的雙語語料庫。該研究成果的論文預印本于9月17日在著名網站arXiv.org公開后,引起了學術界的廣泛關注。

    新的方法依賴于一個概念,即每一種語言都有一套相似的想法,因而使用單詞的方式也存在相似性。例如,大多數語言中都有描述相同動物的單詞,如“狗”、“貓”和“牛”,這些單詞很可能以相同的方式在句子中使用,如“貓是一種比狗小的動物”。

    125495597_71n

    英語與西班牙語的數字向量空間圖

    數字也一樣;上圖顯示了在英語和西班牙語中數字(一至五)的向量表示法以及它們是如何相似的。

    語言中單詞之間的關系集合被稱為“語言空間”(language space),可類比為一個點到另一個點的向量集合,能以數學的方式進行處理,例如“國王”減去“男性”加上“女性”等于“女王”(“king”–“man”+“woman”=“queen”)。

    在向量空間中,許多語言都有共通之處,可以利用向量空間線性變換將一種語言翻譯成另一種語言。工程師們說,“盡管它很簡單,我們的方法出奇有效;在翻譯英語和西班牙語之間的單詞和短語時,準確率可以達到幾乎90%。”

    中國數學家和語言學家周海中認為,這種基于線性代數的機譯方法很有新意也有實效。不過,他對不同語系的自然語言(如英語和漢語)在線翻譯是否也有那么高的準確率表示懷疑。他強調:不管用什么方法來提高機譯質量,首先要解決的是自然語言的本身問題,尤其是語義表達和語用功能,而不是計算機編程問題或數學建模問題。“在人類尚未明了大腦是如何進行自然語言的模糊識別和邏輯判斷的情況下,機譯質量要想達到‘信、達、雅’的程度是不可能的。”周海中說。

    谷歌 向量空間

    相關閱讀

    暫無數據

    一周熱門

    主站蜘蛛池模板: 国产精品你懂的| 国产精品嫩草影院一二三区入口| 久久99久久99精品免视看动漫| 99久久精品免费国产大片| 亚洲国产精品福利片在线观看| 国产精品户外野外| 99麻豆久久久国产精品免费| 亚洲精品中文字幕乱码三区| 久久久久久青草大香综合精品 | 国产精品免费福利久久| 四虎亚洲国产成人久久精品| 国产精品国产高清国产专区| 国产精品爱啪在线线免费观看| 色久综合网精品一区二区| 久久国产午夜精品一区二区三区| 2024国产精品极品色在线| 国产成人精品2021| 少妇人妻精品一区二区三区| 日韩精品欧美亚洲| 精品人妻系列无码人妻免费视频| 国产AV国片精品一区二区 | 无码国产精品一区二区免费式芒果| 欧美精品一二区| 久久久久国产成人精品亚洲午夜| 国内精品伊人久久久久网站| 国产成人精品久久亚洲高清不卡| 免费欧美精品a在线| 精品久久久久久国产| 91精品在线看| 成人精品在线视频| 99精品无人区乱码在线观看| 东京热TOKYO综合久久精品| 国产精品乱码高清在线观看| 精品久久久久久久久午夜福利| 老司机亚洲精品影院无码| 乱精品一区字幕二区| 国产精品亚洲A∨天堂不卡 | 国产午夜精品久久久久九九电影| 办公室久久精品| 国产91在线精品| 国产一区二区精品尤物|