有時候光是看課本、講義、武功祕笈、他人筆記、網路文章等等,仍然想知道道地的native speaker到底怎麼怎麼說或寫嗎?來學學使用語料庫吧!

語料庫到底是什麼?

語料庫的英文是 corpus,意思是 A collection of written or spoken material in machine-readable form, assembled for the purpose of linguistic research. (書面、口語資料的集合,以電腦可辨識的方式呈現,供語言學研究使用),基本上就是由電腦彙整大量的文本 (text) 、實際的中、英文語料,供後續分析、檢索、對比等。

過去,字典的編篡或許是靠編者自行收集、造句,現在,幾乎所有的字典都強調以語料庫進行編篡,例句都是取材自真實的語料。如Cambridge、Oxford、 Macmillan等著名的字典。

語料庫對譯者來說是很重要的幫手,尤其在翻譯第二語言(如中文到英語) 時,語料庫能幫助譯者快速確定搭配字和用字精準度,用最自然、道地的英文來表達。對一般英語學習者來說,當你已累積一定字彙量,文法也學得差不多時,就可以靠語料庫快速檢視該字在現實生活中的用法,利用語料的比例分析,找出最常使用的搭配語;在字典上看起來意思差不多的字(沒錯,就是那一大串同義字),在實際用法上往往也會有些許不同,這也可以透過語料庫整理差異。面對不好理解的文法,語料庫用大量資料證明給你看。

以下推薦5個超容易上手的語料庫:

1. Google

沒錯就是它,如何用google快速確定你寫出來的英文道不道地?請多加使用 「" “」 這個符號!加了quotation mark 後,google會搜尋用字順序完全相同的整個詞組。

例如,你想知道 “生計" 的英文怎麼翻比較好,除了 google translator 提供的 “livelihood" 外,你想試試 “source of income" 是不是正確的用法,這時,搜尋 “source of income" ,你會看到「“約有 97,800,000 項結果」顯示出來,代表這個用法是 ok 的啦!大概掃過搜尋結果後,你就可以大方用下去,確保寫出來的英文不會帶有外國腔。

2. Netspeak

點進來就會看到這個畫面,點進 》這個符號裡就可以看到更完整、附上舉例的解說。可以搜尋單一字詞、多個字詞、比較兩個用法、確認字詞順序等等。例如: 在搜尋中打上「? an application」會出現:

便可以看到和application最常搭配的字是submit"(提出申請),另外像 make(提出申請)、complete(完成)、file (提出申請)等字也都很常使用,點後面的 + 號,便可看到來自真實語料的例句:

再點入句子後方的箭頭,便可直接連到那句子原本的網站。這樣的設計可以讓你同時學到一個字或片語的很多用法,並可以看看多是在那些內容(書寫or口語?關於什麼主題?)、場合(正式or非正式)、被哪些人物(官方文件or一般部落格)使用。