汉语语法及应用研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

6 结语

本文在机器学习方法的基础上,利用隐喻相似度推理、词典信息等多种方法对“n+n”模式进行识别实验。实验表明以最大熵为基础的识别方法,辅助CCD的概念推理,汉语隐喻知识库的配合,取得了令人满意的效果。相似度计算中有待于解决的问题如下:

训练语料和测试语料出现的近义词语在CCD中没有出现,机器无法进行判定。例如:

训练语料中有:高峰 共/d攀/v <棋艺/n高峰/n>

测试语料中有:顶峰 攀登/v上/v世界/n <棋坛/n的/u顶峰/n >

同义词集合为:15_06349777 【顶 山顶 顶峰 高峰 最高峰】

根据CCD词典提供的信息,“高峰”和“顶峰”来自同一个概念集合,符合n2的推理原则。如果能够判断出“棋艺”和“棋坛”具有相似性,就可以从训练语料中的隐喻表达“棋艺/n高峰/n”推断出测试语料中“棋坛/n的/u顶峰/n”也是隐喻。但是不幸的是在CCD中“棋艺”和“棋坛”两个词语均未收入,因此对“棋坛/n的/u顶峰/n” 无法作出推断。隐喻表达所在的上下文是识别的重要线索,如果上下文中出现过多的未登录词语,势必会影响推理的效果。

因此,扩充面向隐喻理解的CCD未登录词语将是提高识别效果的关键所在。隐喻识别研究不仅从知识库的角度增加了隐喻映射的描述,同时也对CCD未登录词语的收取提出了更好的反馈。


参考文献:

[1] Gentner, D. Falkenhainer, B. and Skorstad, J. Viewing Metaphor as Analogy [C].In Helman, D.Editor, Analogical Reasoning, Kluwer Academic Publishers, 1988.

[2] Gentner, D. Structure-Mapping: A Theoretical Framework for Analogy [J]. Cognitive Science, 1983, 7: 155-170.

[3] Martin, J. H. A Computational Model of Metaphor Interpretation [M]. NY:Academic Press, 1990.

[4] Mason, Z. A Computational Corpus-Based Metaphor Extraction System[D].Brandeis University, 2002.

[5] Xiaoxi Huang and Changle Zhou. A logical Approach for Metaphor Understanding[C]. International Conference on Natural Language Processing and Knowledge Engineering(IEEE NLP-KE), 2005.

[6] 张威、周昌乐,2004,汉语隐喻理解的逻辑描述初探,《中文信息学报》第5期。

[7] Zhimin Wang, Houfeng Wang, Huiming Duan et al., Chinese Noun Phrase Metaphor Recognition with Maximum Entropy Approach[C].Seventh International Conference on Intelligent Text Processing and Computational Linguistics.Springer,2006: 235-244.

[8] 刘扬,2003,双语WordNet语义知识库的构造理论与工程实践,北京大学博士学位论文。

[9] Li Sujian, Zhang Jian, Huang Xiong, Bai Shuo and Liu Qun. Semantic Computation in a Chinese Question-Answering System[J]. Journal of Computer Science and Technology, 2002, Vol,17, No.6: 933-939.

[10] 刘群、李素建,2002,基于《知网》的词汇语义相似度计算,《第三届中文词汇语义学研讨会论文集》, URL: http://www.keenage.com/html/paper.html.

[11] Leacock C, Chodorow M. Combining Local Context and WordNet Similarity for Word Sense Identification[C]. Felbaum C ed.WordNet: An Electronic Lexical Database. Cambridge, MA:MIT Press,1998: 265-283.

[12] Wu, Z., and Palmer, M. Verb Semantics and Lexical Selection[C]. In 32nd Annual Meeting of the Association for Computational Linguistics, 1994: 133-138.

(原载《中文信息学报》2008年第3期)