第3回Solr勉強会に行ってきました
毎回勉強になります。前回ご挨拶させていただいた人の顔を忘れていて帰り道に思い出したり。名刺忘れるのも毎回やないか…
あと、すごい豪雨だった。
内容はスライドを公開されている方が多いので、なんとなく心に掛かったところだけメモ
株式会社ロンウイット 関口さま
・4からflexible indexing。再インデックスなどが必要になる
・作り直すのがよいといわれている
・byteで保存できるようになる。termがbyteになる(sort orderもcharからbyteになる)
・nested document query
・field collapsing
・solrcloud
・japanese tokenizer(aka tiny segmenter) 辞書なしらすい
株式会社サイバーエージェント 田代さま、安田さま
・もともとはluceneを使っていた
・2009年末から二ヶ月で作成。(その後一ヶ月でインポート
・つかえるディスク容量の話
マピオン 岩澤さま
・電話帳検索で三十分で落ちた。
・朝の十時にピークがあるらしい。(なんでだろう?)
・ZFSのキャッシュを使っている
・1000万クエリ/日は四台で捌いている
・ピークは400クエリー/s
チームラボ 田村さま
これはSolrとは関係なかったけどおもしろかった。
・感覚とか数値をきちんと扱う検索が実は存在しない
・認識した情報をテキストに変換することで通常の検索ライブラリに載る
・色と形状と特徴量をOpenCVなどで取り出してテキスト化
・この服の色の靴を買うとかできるらしい。
・画像の類似度を使うということは採用しなかった
→理由:ユーザーの操作が難しくならないようにするため。
Q:こういうデザインのやつ!っていう検索は出来ないと思うが?
→A.商品の形状・魅力などはキーワードで十分説明されていると考えることもできる
LT Basis Technology 黒坂さま
lucid imaginationのサービスをベイシスさまが提供するとのこと。
魅力としては日本語サポートと時差の問題の解消、日本語や各種課題に対するノウハウが加わるというところかと思われます。SolrやLuceneの利用が加速するかな?
Tシャツいただきました!ありがとうございます!デザインはこんな感じ。僕の美的感覚からすると全然着れますw
(クリックするとでかくなります)
LT ECナビ 春山さま
JVMのチューニングのお話。GCとの戦いですね…
MaxTenuringThresholdってどうやって調整していけばいいのか分からない…他のオプションもそうだが…