不可視点

search guy at cookpad.com

第3回Solr勉強会に行ってきました

毎回勉強になります。前回ご挨拶させていただいた人の顔を忘れていて帰り道に思い出したり。名刺忘れるのも毎回やないか…
あと、すごい豪雨だった。

内容はスライドを公開されている方が多いので、なんとなく心に掛かったところだけメモ

株式会社ロンウイット 関口さま

質疑で次のリリース時期を聞くのはやめたほうがいいと思うw

・4からflexible indexing。再インデックスなどが必要になる
・作り直すのがよいといわれている
・byteで保存できるようになる。termがbyteになる(sort orderもcharからbyteになる)
・nested document query
・field collapsing
・solrcloud
・japanese tokenizer(aka tiny segmenter) 辞書なしらすい

株式会社サイバーエージェント 田代さま、安田さま

新規開発局という部門があるのだそう。
・もともとはluceneを使っていた
・2009年末から二ヶ月で作成。(その後一ヶ月でインポート
・つかえるディスク容量の話

マピオン 岩澤さま

マピオンさんはかなり長期間ZFS使っている気がする。簡単に使えるものなのだろうか?
・電話帳検索で三十分で落ちた。
・朝の十時にピークがあるらしい。(なんでだろう?)
ZFSのキャッシュを使っている
・1000万クエリ/日は四台で捌いている
・ピークは400クエリー/s

チームラボ 田村さま

これはSolrとは関係なかったけどおもしろかった。
・感覚とか数値をきちんと扱う検索が実は存在しない
・認識した情報をテキストに変換することで通常の検索ライブラリに載る
・色と形状と特徴量をOpenCVなどで取り出してテキスト化
・この服の色の靴を買うとかできるらしい。
・画像の類似度を使うということは採用しなかった
→理由:ユーザーの操作が難しくならないようにするため。
Q:こういうデザインのやつ!っていう検索は出来ないと思うが?
→A.商品の形状・魅力などはキーワードで十分説明されていると考えることもできる

LT Basis Technology 黒坂さま

lucid imaginationのサービスをベイシスさまが提供するとのこと。
魅力としては日本語サポートと時差の問題の解消、日本語や各種課題に対するノウハウが加わるというところかと思われます。SolrやLuceneの利用が加速するかな?
Tシャツいただきました!ありがとうございます!デザインはこんな感じ。僕の美的感覚からすると全然着れますw
(クリックするとでかくなります)

LT ECナビ 春山さま

JVMのチューニングのお話。GCとの戦いですね…
MaxTenuringThresholdってどうやって調整していけばいいのか分からない…他のオプションもそうだが…

勉強会に参加してみて

・個々の検索アプリケーションをどのように改善していくかという話が聞きたい。要求ごとにどのコンポーネントをいじりましたみたいなのとか
JVMの設定、複数台での運用が前提なのでSolrの分散構成のベストプラクティスをさぐる話
が聞けたと思いました。あと、開発者募集している方が多かったw