Title :新聞記事の文章末表現における特異的名詞語彙の出現特性
Title alternative :Frequency of particular noun usage in closing sentences in newspaper articles
Authors :本間, 愛
中村, 隆志
Publisher :情報処理学会
Issue Date :Jan-1999
Journal Title :情報処理学会研究報告. 人文科学とコンピュータ研究会報告
Volume :99
Issue :5
Start Page :7
End Page :14
ISSN :0919-6072
Abstract :新聞記事の文章末に着目し、文書の文字数が大きくなるほど、文章末に出現する頻度が高くなるような名詞が存在するかどうか調査する。資料として、新聞記事データベース1年分から、キーワード検索を用いて得られる文書群の内、文書数が500から1500までの文書群を全て取り上げる。文書群の数は495個である。ある文書群に於いて、文書の文字数が増加するに連れ、文章末での出現頻度が増加する名詞を、その文書群の"大河ターム"という造語で呼称する。495個の文書群からの抽出の結果、480個(〜97.0%)の文書群からのべ4158個の大河タームが取り出される。大河タームの20%弱は、抽出に用いた文書群の頻出名詞であることがか確認される。複数の文書群から重複して抽出される回数が大きい大河タームの内、いくつかは、他の文書群での頻出名詞になることがなかったこと、つまり、長い文章の締め括り部分で使用され易い名詞が存在することが確認される。
We focus on the, frequency of noun usage in the closing sentences of a group of newspaper articles. We investigate the existence of terms whose usage frequency in the closing sentences increases as the article length increases. Data are compiled from 495 groups of news paper articles obtained from the Nikkei Newspaper Database '97 which include more than 300 and less than 1500 articles. The nouns are called "taiga terms" whose usage frequency in the closing sentences of each article increases as the article length increases ("taiga" means 'big river' in Japanese). 4158 "taiga terms" were extracted from 480 article groups. A little less than 20% of "taiga terms" are the most frequently used nouns. Some "taiga terms" are repeatedly extracted from many groups of newspaper articles, and they are not the most frequent houns in any groups of newspaper articles.
