イメージ
すっごく単純にすると
- 大人な語
- 語がどれほど大人か
- $$大人(眼球) = \log \frac{n(眼球, off)}{n(眼球, strict)}$$
- ただしn(q,a)はクエリqのセーフサーチの設定aのoff/moderate/strictのとき結果件数.検索結果が0件の場合もあるだろうから分母には1足しておいてもいい.
- 大人な組み合わせ
- 語を組み合わせることでどれくらい大人っぽくなるか
- $$大人組(目玉, 玉子) = \log \frac{n(目玉 and 玉子, off)}{n(目玉 and 玉子, strict)} - 大人(目玉) - 大人(玉子)$$
みたいな感じ.あんま考えてないのでこれで比較ができるかわかんないけど.大人がゲシュタルト崩壊…
でも
普通に考えてセーフサーチが強いほうが検索結果少ないだろ,と思ってたら,
眼球 - Google 検索
セーフサーチ: オフ
約 57,800,000 件 (0.20 秒)
眼球 - Google 検索セーフサーチ強のほうが多いこともある…どういうことだってばよ
セーフサーチ: 強
約 71,800,000 件 (0.19 秒)
Bingもあんま変わらん.そういうもんなのかな.
ちなみにWebの検索結果件数を使って人間関係を抽出している論文(件数だけじゃないけど)→Web 上の情報からの人間関係ネットワークの抽出
No comments:
Post a Comment