[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
Googleを使って機械、つまりコンピュータに語の意味を理解させよう、というか、ある文脈においてある語がどういう意味で使われているかを、machine-processableな形で確定しよう、という試み。
基本的な考え方としては、たとえば"hat"という語の意味を理解したい、あるいは文脈での意味を確定したいという場合、その"hat"という語と、も一つ任意の語の対でブーリアンサーチをかける。そうすっと、たとえば(hat, head)という対の方が、(hat, banana)という対よりもGoogleでのヒット数が多く、ゆえに"hat"という語の意味上の親和性は"banana"とよりも"head"との方が高い……って、こういうプロセスをギチギチ詰めてくと、あら不思議、"hat"の意味がコンピュータにも分かる、も少し控えめに言うと、少なくともどういう文脈で"hat"という語が使われるかコンピュータにも区別できる、ってことなんだけど、どうなの?
「ある文脈である語がどういう意味で使われているか」ということの「理解」だったら、上述の方法で出来るような気がするんだけど、端的に「その語の意味を理解」ってことになると、ちょっといぶかしいなあ。
まあ、これから上記論文を読んでみるけど、何より気にかかるのはGoogleのブーリアンサーチを使ってる、ってことだよね。しかも、統計的な使い方をしている。これが、何にも処理をしていない生データのランダムサンプリング、とかいう形でGoogleが検索結果を出してくれるんだったら、各種統計手法で推定も出来ると思うけど、何せPageRankかましちゃってますからねえ。ここでもうすでに無視できない偏差が生じてるわけで。
そんなわけで、最近Google問題でにぎわっているLanguageLogの人たちがこの論文にどう反応するか、それも楽しみ。
12 | 2025/01 | 02 |
S | M | T | W | T | F | S |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
音
雑
虫
技術
『スペクタクルの社会』を読む
ドゥルーズ講義録
電波
趣味の数学
趣味のゲーデル
『プリンキピア・マテマティカ』を読む
自己紹介もどき
ブログペット俳句
芸術一般
言語ヲタ
お客様
GRE CS
留学
Boing Boing
映画
ちょっといい話
かなりダメな話
魂の叫び
哲学と数学
論文
引用
「いい」とも「ダメ」とも言いがたい話
悲喜こもごも
証明論
ポエム
書物への呪詛
言わずもがななことではあるけれどときに忘れてしまうこと
何か無駄なことをしよう
日々
趣味の勉強
夢
ブログの記事
翻訳
勉強
不眠
文房具
ライフハック
育児
thayashi#ucalgary.ca
(#を@に置換してください)
このブログで紹介したことのある本をランダム表示。
このブログで紹介したことのある音をランダム表示。