| 退出

編詞典:從卡片到語料庫

作者:呂海春 發布時間:2021.09.15
中國教育報

《現代漢語詞典》首任主編呂叔湘先生說:編詞典“要有人,要有物,就是物質條件,還要有計劃和組織”。編詞典最重要的物就是資料。

作為新中國成立以來第一部主要收錄普通話詞匯的《現代漢語詞典》,在編寫時,遇到的難題之一就是沒有可借鑒的資料。以往的詞典以古漢語詞匯為主,因此一切都要白手起家。在資料收集方面,呂先生定下的方針是:書面與實際生活并重。一方面要從當時的報紙雜志、現代文學作品和新中國成立后出版的通俗讀物中收集,并規定有些書要一個詞不漏地窮盡收集;另一方面, 特別強調要有系統地收集各行各業中流通的詞匯。呂叔湘先生曾讓語言所詞典室的同志到百貨大樓去收集商品名稱。他解釋說:“為什么新詞新義,特別是口語里的新詞新義沒有受到編詞典的人重視呢?因為編詞典的人是‘讀書人’,對書本里的東西感興趣,對生活中的東西不感興趣,或者不太感興趣;對書齋中來的東西比較敏感,對市場上來的、車間里來的、田野里來的就不那么敏感。找詞匯只在著名作家、著名作品里找,一般報刊就不大理會,至于什么手冊、傳單、廣告等等就更不在話下了?!闭_的資料收集方針保證了《現漢》收詞的科學性、系統性、現代性。

同一個詞要在不同場合被收集多次,制成若干張卡片,才能證明被社會廣泛應用,成為待選。在沒有計算機的年代,這項煩瑣細碎的工作完全靠編纂人員在日常生活中像螞蟻搬家似的逐漸積累。為編纂《現漢》,工作人員最終收集了100多萬張卡片,這些都成為編纂《現漢》堅實的語料基礎,也是重要的歷史資料。

如果把自上世紀50年代《現漢》開始編寫以來,編輯們收集的卡片裝進柜子,卡片柜在百來號人開會的大廳里擺上一圈還放不下。

如今,利用計算機語料庫收集資料、統計詞頻早已成為辭書編纂的必然選擇。但機器再靈,在某些方面也不能完全代替人的大腦和眼睛。時至今日,詞典室的同志們依舊是把這兩種手段結合起來。第6版修訂主持人、中國社科院原副院長江藍生先生介紹說,在第6版修訂過程中,編者們利用語料庫,持續監控網絡時發現,“電腦只能根據詞頻來進行挑選,但‘語料庫’這種軟件的內容選取往往不夠穩定,不能取得均衡意義上的目標詞匯”。因此,還要靠每個成員平時對閱讀材料的記錄與留心。事實上,從《現漢》第1版問世以來,收集新詞的工作從未停止。詞典室的同志們養成了職業習慣,仍然堅持用手眼廣泛收集報紙、書刊、電視、廣播等媒體上的新詞新義,制成卡片,以備修訂所用。第5版修訂主持人之一的晁繼周先生說:“我們這些人讀書看報都要比一般人慢,一句話要拆成語素看?!泵坑龅叫略~,詞典編輯室的同志們都會用紅筆圈出來,將報紙剪貼或抄寫,制成卡片。最早參加《現漢》編寫工作的孫德宣先生,直到89歲,還在家堅持收集資料,做資料卡片。編輯們碰到一塊,談論最多的也是最近發現的新詞。這正是從呂先生時代就一直堅持的做法,是保證《現漢》在資料上永遠有源頭活水的好傳統。

(作者系商務印書館漢語編輯中心編審)

《中國教育報》2021年09月15日第9版 

最新文章
相關文章
欧美亚洲色欲色一欲WWW