民初思韻網

加入收藏   設為首頁
選擇語言   簡體中文
你好,請 登陸 或 注冊
首頁 人文思韻 傳奇人物 歷史思潮 時代作品 話題討論 國民思韻 民初捐助 賬戶管理
  搜索  
    歷史思潮 >>> 新興科技、社會發展等人文科學探討
字體    

談《規范漢字表》的制定與應用
談《規范漢字表》的制定與應用
網載     阅读简体中文版


  一、信息時代是漢字規范的必要性更加突顯的時代
  我國現代漢字規范工作醞釀于20世紀初期。新中國成立后,由于一些領導人的提倡,這項事業由學術層面轉為國家行為,20世紀50年代以來的漢字規范政策,重要的是由國務院直接發布的,一般的或補充性質的,也是在國務院批轉的情況下,由文化、教育、出版或語言文字主管部門單獨或聯合發布的。這些文件的發布和半個世紀的貫徹實踐,為我國人民的語言文字生活注入了新的內容,形成了全國人民尤其是語言文字工作者牢不可破的規范意識和遵循規范的用字習慣,減少了各個領域使用漢字的難度,對文化、教育、出版和科技的發展,起到了無形的重要推動作用。試想一下,在幅員遼闊、人口眾多的中國,政治經濟如此統一的情況下,如果沒有通用層面的漢字規范,僅僅是國家政令和基礎教育這兩項,書寫不一的漢字將要帶給人們多少麻煩,就可以知道“規范”二字具有多大的分量了!
  1979年以來,國家改革開放,國情發生了巨大變化,中國正在實施的創新型國家的偉大戰略中,信息化成為實現這一目標的重要支撐。有人說:“現在的文字已經很少手寫,計算機的貯存空間又這樣大,規范的必要性已經逐漸減退了。”這種想法只是從個人使用漢字的角度看問題,是不符合實際的。在信息時代,發展政治、經濟、文化的重要條件,是及時和準確地獲得必要的信息,并把需要傳播出去的信息及時和準確地傳播出去。計算機成為傳播信息的工具,實現了信息傳播的高速度、遠距離和高度的社會化。由于信息的遠距離傳播,輸出者與接受者是兩頭不見面的;在重大問題上,信息傳播的兩端已經不是一人對一人,而是一國對另一國、一個群體對另一個群體,信息的社會性得到了充分的體現。在這種情況下,漢字規范的作用就更加突顯出來,可以說,有了漢字這種傳播載體的標準化,才能實現信息傳播的速度和信度。
  二、必須增加規范漢字的字量
  信息化時代漢字規范的一個突出特點是規范漢字的數量需要作一定的補充。從數量統計的角度,常用漢字和通用漢字的數量,不論在什么時代,都保持在3000~7000這個數量范圍內。但是,完全從使用頻率和語料覆蓋率的角度來搜集用字,難以搜集到一些特殊領域的用字。這些特殊領域,在漢字主要是手寫的時代,即使不立標準也不會有太大的問題,而在計算機和互聯網時代,那些在一般語料庫里憑借字頻難以找到的字,在人民的日常生活中卻不失其通用性:
  科技用字。由于科學技術的發展和教育水平的提高,很多科學技術的用語快速進入人們的日常生活。僅僅拿記錄化學元素符號的漢字來說,它們很多要用在藥品名上,當藥方不再手寫而用計算機輸錄時,這些字就不斷地出現在病人的手上。農藥、化肥、室內裝修材料也有不少是要用它們的學名來宣傳、普及的。至于化妝品、清潔劑的使用,飲食健康的講解,氣象的采集和預報等等,一旦進入科學普及領域和基礎教育的教科書,都會受到普遍關注。
  地名用字。地名用字的使用范圍往往不是全國所有地區通行的,但卻屬于當地居民的常用字,鄉以上地名用字又是各省(市、區)不可缺少的。過去,由于民族和方言發音的分歧,經常會產生一些任意造的轉語字(即當地人根據方音自造的形聲字),造成用字的混亂。在戶籍、郵政、信貸、金融等行業的信息貯存和檢索已經數字化了的今天,地名用字的混亂會給有關行業帶來哪些后果,是不言自明的。
  姓氏人名用字。中國是一個多民族的國家,姓氏不但記錄著民族和血緣關系,還成為每個公民的稱謂符號。這些姓氏數量有限,但是必須正確使用,才能保證信息的信度。至于名字所用的漢字,現在已經相當混亂,有些名字的用字甚至在已經擴充到7萬余字的國際編碼中都難以找到,致使第二代身份證的制作由于姓名用字不全產生很大的困難。新的《規范漢字表》無法改變過去的那種姓名用字混亂的事實,但是可以學習一些先行國家的經驗,對以后新生兒起名字作一些限定。這就需要盡量將姓氏用字收全,并在已有的人名用字中選擇足夠的、適合于起名字的漢字進行規范,以保證個人姓名在社會上的有效流通。
  基礎教育文言用字。規范漢字主要是書寫現代漢語文本的,但是,傳統與歷史和現代不是絕緣的,現代文本中會引用文言作品,中小學語文教材中也都會收一部分優秀的文言作品。前者可以在一般的平衡語料庫中收集到,而為了保證教材印刷的規范,需要在語文教材中專門收集文言文的用字。
  以上四個方面,既然已經進入通用層面,為什么又不能在平衡語料庫里依照字頻和覆蓋率收集到呢?這個問題需要從兩個方面解釋:第一,需要全面理解“通用”這個概念。通用包括兩個側面:一個是書寫的側面,一個是閱讀的側面。能夠進入平衡語料庫的漢字,兼有這兩個方面的通行度;但是也有一些漢字,書寫的頻度并不高而閱讀的頻度卻很高。例如,前面說到的西醫藥名、飲食營養學中的化學元素用字,有一些不在社會通用范圍內,因為文本的使用率并不高;但閱讀的幾率卻可以達到千家萬戶。又如,基礎教育語文教材的文言用字,也有少部分不屬于社會通用字,但是每年的教材印刷必須使用,歷屆老師、學生、家長必須面對,也是需要統一字形而進入規范的。第二,以漢字為載體的信息,一部分是在流通領域通行的,還有一部分是儲備領域必需的。例如姓名,除了知名人士,一般的姓名在社會通用層面上使用度不會太高;地名,除了大城市、著名景點,一般的地名在社會通用層面上使用度也比較有限,根據字頻和使用度不能將它們收集出來。但是,無所不往的郵政、金融、交通等事業,無人不用的身份證、戶籍卡、學歷證書、病歷卡等證件,必須儲備可能用到的漢字。如果在信息處理上不去對這些字進行規范,也會引起社會信息儲備和使用的混亂。
  《規范漢字表》所設的三級字表,又稱準通用字表,就是從專門領域提供的專用字中收集的通行字,作為從語料庫的字頻和覆蓋率、使用度中搜集的社會通用字的一種必不可少的補充。
  三、分清“不規范字”與“未規范字”
  《規范漢字表》是記錄現代漢語的通用漢字字集,體現通用漢字在字量、字形等方面的規范。上世紀50年代以來陸續制定的規范字表,因指導思想不完全相同,研制手段有差別,針對的社會用字情況有不小變化,使這些規范缺乏內部的一致性以及對當下語言生活的適應性。因此,需要站在現代的歷史高度,利用現代技術手段來考察當代用字的實際,對已有的規范進行梳理,消除其間相互抵牾之處,彌補因各種原因造成的疏漏,將一些隱性的規范顯性化,增加現代語言生活的新內容,從而使已有的漢字規范得到整合、優化,為構建和諧的語言生活打下基礎。
  新的《規范漢字表》有很強的承襲性,為了覆蓋過去的規范,原有的7000通用字只除去了極個別的嚴格異體字,其他全部照收,同時還增加了從科技用字、地名用字、姓名用字和基礎教育文言文印刷用字中補充的準通用字。數量比過去增多了。但是,在社會通用層面上的通用字,并不能囊括每個人、每個領域、每個時間用字的全部,總是有些字不包括在《規范漢字表》中的。有些用字的專業部門担心自己所用的字不在《規范漢字表》內會妨礙將來的使用。這里,我們要明確“規范漢字”對應著的兩個不同的概念:一個是“不規范的字”。已經有了規范漢字,在通用層面上書寫現代漢語文本時,仍然去用對應它的嚴格異體字或繁體字,就屬于不規范字。例如:我們認定“淚”為規范字,“浪”是它的嚴格異體字,不應當出現在現代漢語文本中。我們規定“險”“檢”“劍”“儉”為規范字,一般不要在簡化漢字文本里再出現“險”“檢”“劍”“儉”這樣的繁體字。這樣做,是為了減少冗余的字形,使通用層面上的用字統一起來。當然,如果寫了錯別字,就更是不規范的字了。另一個是“未規范字”,也就是沒有被收入《規范漢字表》中、也不對應任何一個規范字的字。“未規范字”在需要使用的時候,是可以使用的。例如,《規范漢字表》說明,只是要求新生兒起名字時,限制用字表中的字,而字表發布前已經有的人名用字,如果不在字表中,只要不是錯別字,仍然可以使用。因為這些字僅僅是沒有進行規范,或有待于今后繼續規范,是不能與“不規范字”同等看待的。
  新的《規范漢字表》對規范的實施強度和適用的寬松度是有所中和的。也就是說,在有些地方,使用是寬松的。正確使用未規范字,在社會使用逐步趨同后再適應社會約定對這些字進行規范,這對專業領域用字,給了一定的方便。其他還有:第一,大規模的專業古籍文本,是可以采用繁體字印刷的;第二,新的《規范漢字表》,在三級字表(準通用字表)中,解放了一批異體字,并一一注明了它們允許使用的范圍,其他異體字凡能認同為嚴格異體字的,在通用字范圍內,不能使用來生成現代漢語文本,但是這批漢字在歷史典籍中還有識讀的價值,辭書中仍然要保留下來。為了對嚴格異體字進行認定,在新的規范發布后,有關單位會發表新的正異對照字表給使用者作參考。這些都是對規范使用范圍的調整。
  四、按照合理的規則調整印刷通用體的字形
  國務院1986年批轉國家語委《關于廢止〈第二次漢字簡化方案(草案)〉和糾正社會用字混亂現象的請示》的通知中指出,對漢字的簡化應持謹慎態度,維護漢字系統的基本穩定。為了貫徹這個新時期中國文字工作的指導方針,新的規范吸收了歷史上漢字規范的經驗教訓,并認真吸收了語言文字學家和相關專業人員的意見,在照顧社會性的同時,盡量不要偏離漢字自身發展的規律。
  上面說過,新的《規范漢字表》對規范的實施強度和適用的寬松度是有所中和的。除了上面所說的處理寬松的情況外,也有進一步嚴格的地方,主要表現在對印刷字形的處理上:
  新的《規范漢字表》在確定了字級與字量后,主要要規范印刷通用體的字形。首先是宋體字的字形。過去的《印刷通用漢字字形表》已經采取了有力的措施對規范字形的形體進行了統一,但是其中還有一些沒有顧及到的地方。新的規范漢字需要從原有的規范中總結字形的筆畫變異規則,并再次核查所收字,按照規則調整字形。這樣做,首先是計算機處理漢字信息的需要,其次也是使印刷通用體字形的描述更加標準化。
  字形調整需要遵循以下總原則:
  1.尊重漢字結構。字形調整雖是筆形層面的問題,但筆形的變異也會影響漢字的結構;在規定筆形變異規則時,必須尊重漢字結構,不因筆形調整使字的結構模式發生錯亂或因調整筆形產生同形字、易混字等。
  2.考慮宋體風格。宋體字來源于雕版印刷字體,經過工藝美術處理,其筆形及筆畫交接有自身的特點,總體風格講求平直方正、對稱均衡。新的《規范漢字表》的宋體字字形,應盡量符合宋體字的風格特點。
  3.制定統一規則。調整字體,必須制定統一規則。一切規則是在條件的控制下確立的,為了減少隨意性,條件相同的字應按統一規則處理,條件有變化時規則才能變化。印刷字形的美化屬于工藝美術層面,也應考慮規則的一致性。
  4.嚴格控制特例。在按規則處理字形時,會出現一些特殊情況,完全不允許特殊處理個別字是很難做到的;但在處理特例時應闡明充分的理由,盡量減少規則之外的特殊處理字形。
  在總的原則控制下,宋體字的筆畫變異需要有進一步的理性規定。這些規則是從原有印刷通用字形表中總結出來的,同時用來復查新的規范字是否符合這些規則。例如:
  1.橫變提。漢字宋體字形要遵循這樣的基本規則,即:凡左側偏旁最后一筆是橫者,應變提。但是還要有以下補充規則:“丹、舟、女”為左側偏旁時,由于橫在中部,不變提。并應注意:(1)末筆為橫的部件居中,且兩邊是對稱部件,不符合“在左側”的基本條件,末筆的橫不變提,如“輿、轡”。(2)實際書寫時不是末筆的橫不變提,如“慧”。
  2.豎變撇。基本規則是:“豐”“半”等作左側偏旁時,豎變撇。如“邦”“判”等。
  3.捺變點。基本規則是:一字有兩個或兩個以上捺筆時,其中一個變點。上下結構的字,上覆下者下部的捺變點,下承上時上部的捺變點。但是還要有補充規則:有幾種情況可不變點:(1)辶、廴、走等作左側偏旁、用最下一筆捺承托右側偏旁,稱作平捺。上面如果出現斜捺,而兩捺之間有其他部件或筆畫組相隔的,捺不變點。如“趁”“逶”等。(2)有三個捺的,只有中間一捺變點,其他不變,如“途”等。(3)品字型的三個捺,如“鑫”“森”“眾”,下方左側的捺改點,其他不變。(4)捺居中,且兩邊是對稱部件者,不變點,如“瓣”“掰”等。
  4.豎折勾變豎提。基本規則是:凡在左側部件的豎折鉤變豎提,如“巽”等。如有兩個豎折鉤且右面還有其他部件,兩個豎折鉤都變豎提,如“劗”等。個別例外:變豎提容易造成字形混淆者,可不改:如“創”左側的“倉”豎折鉤變豎提后與“饣”形近。
  5.豎勾、橫折勾去勾。基本規則是:(1)豎勾在底部都應去勾,如“條、茶、殺、親”等。(2)“瞥”“勇”等上面的部件一律去鉤。補充規則是:以下幾種情況可不去鉤:(1)“余”單用及作部件時都帶勾。(2)為避免形近混同,“亦”不去鉤。
  除此以外,新的《規范漢字表》還對類推簡化進行了嚴格的限制。
  原有的《簡化字總表》第二表規定了“可作簡化偏旁用的簡化字和簡化偏旁”,共有132個簡化字和14個不成字的偏旁,可以進行類推簡化。在《現代漢語通用字表》范圍內,類推簡化.的原則已經貫徹,并出現了一些同形字和不合規律又沒有依據的“人為新造字”,但因已經形成社會用字習慣,不能再改動。如果對《規范漢字表》中的三級字繼續進行無限制的類推簡化,必將產生為數不少的難以復原、難以辨認的人為新造字或同形字;但是如果三級字不進行類推簡化,又無法與一、二級字保持字形上的一致。面臨這種兩難境地,《規范漢字表》的三級字實行“有限類推簡化”,以保持漢字原有結構不變。其具體細則是:(1)按《簡化字總表》第二表規定的132字與14個偏旁的范圍類推,不擴大范圍。《簡化字總表》第一表的繁體字作構字部件時,無論是整體或局部一律不類推簡化。如“讏”,不能簡化為“(上)衛(下)言”,也不能把上面部件居中的“韋”簡化為“韋”。(2)采用“部分代替全體”原則簡化的字(如“親”“產”“從”“豐”“廣”“鄉”“殺”“與”“云”等),以及結構產生變化的字(如“備”“薦”“雙”“義”等),只在第一層次構字時類推,以保持原字的結構不受影響。(3)采用以上原則產生難以識別的怪異字或同形字時,為保持字與字的區別,宜作個別變通處理。不予類推簡化。
  在大型辭書中實行“無限類推”對查閱者是十分不利的,這不但會產生一些新的字形,使漢字的冗余形體增多,而且大型辭書的收字是備查的,改動了歷史字形,使讀者在閱讀文獻時遇到難字無法按原有字形查詢該字,完全失去了辭書編纂的意義。所以,在《規范漢字表》發布后,根據國務院1986年指示的“今后對漢字的簡化應持謹慎態度,使漢字的形體在一個時期內保持相對穩定”的精神,表外字原則上不再類推,但前面已經說過,這些字仍可允許以歷史原字形式使用。
  五、防止對《規范漢字表》應用的簡單化
  《規范漢字表》規定了字級、字量和字形,但這是根據普遍社會應用層面來確定的,在教育、教學領域制定應用字表,既要遵循《規范漢字表》的規定,又不能簡單截用其中的一段使用。這是因為,在一些專業領域里,會有一些其他規律在起作用。例如:在確定基礎教育識字教學的分級字表或對外漢語分級字表時,如果簡單地采用按照字頻來分級,將會造成應用上的諸多問題。因為,教學要遵循循序漸進的原則,由易到難,而社會普遍應用層面的字頻,與漢字的難易度和構形相互依存的系統是不一致的。我們可以比較以下三種語料庫中不同的字頻排列。下表是同一個字在不同語料庫里的頻序比較:
漢字                 中      國    發      年    成    種    分    體    物國家語委平衡語料     13      21    29      33    43    50    52    73    80庫頻次教育與科普綜合語      9      26    31      39    24    37    36    38    18料庫頻次(注:該語料庫為《規范漢字表》制定人員綜合合并而成。)適合第一學段兒童    132     156   103     223   119    251   299   541   264 文學語料庫頻次(注:該語料庫為北京師范大學兒童文學專家陳暉老師主持研制。)

  從上表中我們可以看到,表中的9個字,在國家語委平衡語料庫和科普與教育綜合語料庫中的頻次,相去未遠,都比較靠前,而在適合第一學段兒童文學語料庫中的頻次,要靠后得多。這是因為,6~8歲兒童的心理詞典,與成人用詞有較大的差距。事實說明,在制定課程標準時,分級字表不應當也不可能超越《規范漢字表》的一級(常用)字表,但是,簡單按《規范漢字表》的頻次來截取字段的辦法是不可行的,正確的辦法應當根據教學實際與兒童不同年齡段的心理特點,采用漢字必要的屬性作參數,經過認真的科學研究,才能生成適用的應用字表。也就是說,在基礎教育確定選字范圍時,對《規范漢字表》的常用字表應當“不離不棄”,而在具體選字時,則應根據應用的特點慎重研究,“各取所需”。

語言文字應用京2~7H1語言文字學王寧20082008
漢字規范/信息化/通用字/專用字
本文闡釋了新的《規范漢字表》制定中的一些原則問題。文章認為,信息時代是漢字規范必要性更加突顯的時代。漢字進入計算機,信息傳播實現了高速度、遠距離和高度社會化,給漢字規范提供了新的思路:首先是規范字的數量要有所增加;其次是規范的實施強度和寬松度要有所中和;再次是對《規范漢字表》的應用既要“不離不棄”,又要“各取所需”。這樣才能既有利于信息時代政治、經濟、文化的發展,又能有利于構建全社會和諧的語文生活。
作者:語言文字應用京2~7H1語言文字學王寧20082008
漢字規范/信息化/通用字/專用字
2013-09-10 21:39

歡迎訂閱我們的微信公眾賬號!
春秋茶館訂閱號
微信號 season-tea(春秋茶館)
每天分享一篇科技/遊戲/人文類的資訊,點綴生活,啟迪思想,探討古典韻味。
  清末民初歷史人物  民初人物
傳奇人物傳記 風華絕代 物華天寶
此間選取古往今來傳奇人物的傳記與軼事,事不分大小,趣味為先,立意新穎,足以激越古今。
為傳統文化招魂
錢穆(1895年7月30日-1990年8月30日),原名恩,字賓四,江蘇無錫人,歷史學家,儒學學者,教育家。錢穆對中國古代政治制度有良好觀感,認為中國傳統政治非但不是君主....
資助民初精神網
        回頂部     寫評論

 
評論集
暫無評論!
發表評論歡迎你的評論
昵稱:     登陸  註冊
主頁:  
郵箱:  (僅管理員可見)

驗證:   验证码(不區分大小寫)  
© 2011   民初思韻網-清末民初傳奇時代的發現與復興   版權所有   加入收藏    設為首頁    聯繫我們    1616導航