Namazu全文検索システム
1 :名無しさん@お腹いっぱい。 :2001/06/14(木) 09:17 ID:???.net 全文検索システム Namazu http://www.namazu.org/ 日本語全文検索エンジンソフトウェアのリスト http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html 前スレ http://tako.2ch.net/test/read.cgi?bbs=perl&key=981352718
2 :名無しさん@お腹いっぱい :2001/06/14(木) 15:26 ID:???.net いか焼きそば
3 :名無しさん@お腹いっぱい。 :2001/06/15(金) 01:24 ID:???.net namazuはカスタマイズがやりにくいのが嫌いだ。 作り直しきぼん。
4 :名無しさん@お腹いっぱい。 :2001/07/05(木) 09:41 ID:???.net http://64.124.197.202/main.htm namazuってやっぱり負荷かかるのかな。
5 :名無しさん@ディストリいっぱい :2001/07/05(木) 10:22 ID:wD33sdDI.net >>4 index作る時にはCPU使用率100%になります。 項目がいくつもあるとかなりツライです。 ↓うちのNamazu http://2ch.dyn.to/
6 :名無しさん@お腹いっぱい。 :2001/07/05(木) 17:05 ID:???.net 100%?(w すご・・・
7 :でり :2001/07/06(金) 02:36 ID:???.net >>5 ん、それは負荷テストに参加してくれというお誘いかな (w
8 :名無しさん@お腹いっぱい。 :2001/07/09(月) 00:57 ID:muVIdrhs.net ここ見てユーザーディレクトリにインストしちゃっていいもんでしょうか? http://www.amays.com/~mizusawa/namazu_kaisetu/noSUinstall.html 当方レンタルサーバー 専用サーバー持つ金ありません。 C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。 っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗
9 :名無しさん@お腹いっぱい。 :2001/07/25(水) 04:10 ID:OjwNZy2I.net インデックス構築中に検索かけられるとCGI TimeOut出ちゃうことが多々あります・・・ http://www1.odn.ne.jp/mimizun/
10 :名無しさん@お腹いっぱい。 :2001/07/25(水) 18:41 ID:smjKvwXM.net nice で優先度落とせばいいじゃん。
11 :名無しさん@お腹いっぱい。 :2001/08/01(水) 18:06 ID:ix6uIOfU.net windowsだし。
12 :ナナ萌え(゚д゚)ウマー :2001/08/02(木) 00:34 ID:???.net WIN2Kに入ってるインデックスサービスってどーなん?
13 :名無しさん@お腹いっぱい。 :2001/08/04(土) 01:50 ID:aNwZ.JX..net >>12 穴。まさぐられると逝ってしまうぞ。
14 :名無しさん@お腹いっぱい。 :2001/08/10(金) 14:53 ID:A94SLV6Y.net 2.0.6 release age
15 :初心者 :2001/08/11(土) 11:52 ID:???.net NAMAZUのインデックスにはたくさんファイルがありますけど、 いらないファイル(テンプレート等)も多いと思います。 結局必ず必要なファイルってどれなんですか?
16 :名無しさん@お腹いっぱい。 :2001/08/12(日) 00:26 ID:???.net >>15 んー俺もそう言えばわからん、 もともと、俺にとって、このNamazu初めの頃難しすぎた。 その前に、うなぎ食いたいんだよね。腹減ってきた・・・
17 :NAMANAMA :2001/08/12(日) 01:02 ID:TrSLsWVY.net namazu2.0.5なんだけど、共有サーバにインストールしたんですよ。 でも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。 そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね? それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか? マジレスお願いします。
18 :むぎ茶 :2001/08/12(日) 01:08 ID:???.net ばれなければ問題無い。 ┐(´ー`)┌ ┏━━━━━━━━━┓ ┃('Д')y ─┛~~ ┃ ┃むぎ茶 ┃ ┃mugicha@360.cc ┃ ┗━━━━━━━━━┛
19 :名無しさん@お腹いっぱい。 :2001/08/12(日) 01:24 ID:???.net >>17 負荷はかからないけど、ローカルは、めんどくせぇ(涙
20 :名無しさん@お腹いっぱい。 :2001/08/12(日) 17:40 ID:KkZ3OuWw.net Namazu.pm使ってperlでCGIを作りたいんですが… Namazu.pmってあまり人気がないんですか? 参考スクリプト(書籍・サイト)がなかなか見つからなくって 何かありませんか?
21 :名無しさん@お腹いっぱい。 :2001/08/15(水) 21:03 ID:???.net >>20 ない、と思う。 まあしかし機能はシンプルなことこのうえないので、 利用にあたってそんなに難しいこともないと思うけど。 Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。
22 :名無しさん@お腹いっぱい。 :01/08/28 05:33 ID:aw.N/Mco.net どう?namazu使ってつくったやつ。 とりあえず2ちゃんねる全板検索可能です。 http://mimizun.mine.nu/
23 :名無しさん@お腹いっぱい。 :01/08/28 21:59 ID:1JnfOa0A.net お奨め本おしえte
24 :名無しさん@お腹いっぱい。 :01/08/29 00:17 ID:TsF5AU7k.net >>22 これ、すげぇじゃん。
25 :名無しさん@お腹いっぱい。 :01/08/29 02:52 ID:1UTTw6kk.net >>24 どこが?
26 :名無しさん@お腹いっぱい。 :01/08/30 12:01 ID:8CpRLBMo.net namazaってCGIやSSIで出力する内容も検索するんですか?
27 :名無しさん@お腹いっぱい。 :01/08/30 12:11 ID:3TFNK/cI.net namazaは知りませんが Namazuで検索できるのは「ファイル」だけのようです。
28 :名無しさん@お腹いっぱい。 :01/08/30 23:03 ID:YzLgVA/..net はやくpostgresqlのテーブルの中身を検索できるようになっておくれ。
29 :名無しさん@お腹いっぱい。 :01/09/10 22:31 ID:2EURowzo.net >>22 みずずん大丈夫?
30 :名無しさん@お腹いっぱい。 :01/09/10 22:32 ID:???.net みみずんか(藁
31 :名無しさん@お腹いっぱい。 :01/09/11 12:11 ID:liJMw8bE.net XMLの検索ってどうなの?
32 :名無しさん@お腹いっぱい。 :01/09/17 18:14 ID:???.net >>31 filter 書いてくれ。
33 :名無しさん@お腹いっぱい。 :01/09/17 18:18 ID:dMB6uEtM.net >>28 Namazuシステムの構築と活用, ソフトバンク やっぱこれじゃない?
34 :名無しさん@お腹いっぱい。 :01/09/17 18:21 ID:FURvtMLg.net >>28 PostgreSQLスレッドで誰かやってなかったっけ?
35 :名無しさん@お腹いっぱい。 :01/09/17 23:18 ID:???.net >>34 よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを 入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、 テーブル内容検索とはちがうっぽい。 ttp://search.namazu.org/ml/namazu-users-ja/msg01550.html
36 :名無しさん@お腹いっぱい。 :01/09/20 17:20 ID:TUOJrHAw.net PHPファイルを検索できるようにするにはどうすれば良いんですか? ソースがまんま出ちゃうんですけど。
37 :名無しさん@お腹いっぱい。 :01/09/26 22:51 ID:9178Yr9s.net >>36 PHP の出力を検索させたいのなら出力した結果をファイルにして それにインデックスをかけるとかしないと無理。
38 :36 :01/09/27 00:11 ID:IzjiFxn2.net >>37 「出力した結果をファイルにする」ってのは、phpでですか? なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。 Namazuシステムの構築本に書いてないかなー
39 :名無しさん@お腹いっぱい。 :01/09/27 01:15 ID:???.net >>38 php のことよく知らないけど php scriptname.php ってやったら出力されないかな? ところで俺も質問なんだけど、namazu.cgi って検索後は ファイルへのリンクを http://hostname/hogehoge で出力するけど、 こいつを file://hogehoge にする方法って無い? windows でローカルファイルの検索に使いたいんだけど WEB で 探しても見つからなかった。
40 :名無しさん@お腹いっぱい。 :01/09/27 17:20 ID:IzjiFxn2.net >>39 php scriptname.phpだとコマンドすら無いって言われてしまう。 指定先は.namazurcってファイルで設定できる↓参照 http://village.infoweb.ne.jp/~fwnk1502/data/howto2.htm#namazurc
41 :名無しさん@お腹いっぱい。 :01/09/27 22:04 ID:clsPKe1Y.net コマンド版のPHPがないとダメじゃないかねえ。 >>39 はインデックス作成時に mknmz --replace='s#^#file:///' とかでもいけそうだけどどうよ。
42 :39 :01/10/01 05:28 ID:UjeefWpE.net 2chNo1(と思える)過疎板にて反応があって感動。 >>40 .namazurc で Replace http://localhost/ file:// と指定してみてたんだけど、どうやら無効の模様。 この部分(http://hostname) は固定で出力してるのかな? >>41 やってみたけどだめっぽい。 でも他にそれらしいオプションも見つからないね・・・ こういう変な事やる時は cgi 改造しか無いのか、とほほ。 pnamazu か rbnamazu に挑戦してみよう。 ところで >>40 はうまくいったかな? アパッチのモジュール lib_php3.so (だっけ?) しか インストールされてない時は >>41 の 言う通りコマンド ラインで使えるようにしよう。手動で最初からやってみ たこと無いので詳しい説明できなくてごめん。
43 :40 :01/10/04 19:40 ID:4sun3RUk.net 返事遅れてスマソ。 >> 39 うちは Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ http://ark/ みたいな感じになってる。ちなみにこの行と Lang ja_JP.SJISと書かれた行以外は全てコメントアウト php検索はコマンドラインで使えるように設定してみます。 というかコマンドラインで使えるようにする方法すら知らないんだけど。 どこか書いてるとこ知りません? 本でも良いんですけど。
44 :アナログから光までオッケー :01/10/05 02:03 ID:7kq.xdqk.net このサイトはみなさんのインターネット環境の スピードを計ってくれます。また、遅いと思う 人は設定を少し変えることによって無料で スピードを早くすることができます。 お金を出す前に一度試してみては いかがでしょうか。上がりの計測も可能です。 http://cym10262.omosiro.com/
45 :22 :01/10/05 02:47 ID:UlE8Ntsc.net http://www.max.hi-ho.ne.jp/~http/
46 :名無しさん@お腹いっぱい。 :01/12/09 11:02 ID:eU0f+J4K.net だめだ〜Out of Memory!で止まっちゃうよ〜。 一応FAQに書いてあることは試したつもりなんだが・・・。 どうも特定のファイルの時にそうなってるみたい。 なんか落ちやすい文字とか、そういうのあるんかな?
47 :名無しさん@お腹いっぱい。 :01/12/10 22:24 ID:UuNX8sYB.net 設定の問題かどうか
48 :名無しさん@お腹いっぱい。 :01/12/15 22:02 ID:???.net ulimit がらみだと思うけど > Out of Memory もしくは本当にメモリ(+仮想メモリ)が足りないか。
49 :名無しさん@お腹いっぱい。 :02/01/04 06:04 ID:HxTTmUTv.net use POSIX 'strftime'; print strftime "%Y%m%d\n", localtime; こう書くと年月日が出るじゃないですか。 この日付けに7を足す事ってできます???
50 :名無しさん@お腹いっぱい。 :02/01/04 06:04 ID:???.net >49 マルチうざい 資ね!
51 :名無しさん@お腹いっぱい。 :02/01/04 23:19 ID:???.net >>49 逝って良し。 ■解説■ マルチは下げ進行で微妙に煽りつつシカトします 上記例のように古典的な煽りは「逝って良し」 他にアスキーアートを使ったものなど多彩ですが、 サーバーの不可を考慮してかあまり好まれません。 やはりシンプルに「氏ね」など短文なものがベストです。
52 :名無しさん@お腹いっぱい。 :02/01/09 18:03 ID:???.net あげ
53 :名無しさん@お腹いっぱい。 :02/01/12 04:40 ID:???.net age
54 :名無しさん@お腹いっぱい。 :02/01/13 16:11 ID:???.net もう、、下げといてやれよ。。
55 :名無しさん@お腹いっぱい。 :02/01/13 19:32 ID:???.net >>54 再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)
56 :名無しさん@お腹いっぱい。 :02/01/25 06:48 ID:YyTiWZ/9.net 半年で、50位か。1000までいったら感動するな。あげ
57 :名無しさん@お腹いっぱい。 :02/02/18 08:00 ID:TWCf5+1d.net age
58 :1001 Over 1000 Thread :02/02/18 10:21 ID:Qb17d1xd.net このスレッドは1000を超えました。 もう書けないので、新しいスレッドを立ててくださいです。。。
59 :名無しさん@お腹いっぱい。 :02/02/19 07:42 ID:DggBq+7H.net age
60 :名無しさん@お腹いっぱい。 :02/02/20 22:28 ID:???.net 関連スレ 全文検索エンジンNamazu @ Unix板 http://pc.2ch.net/test/read.cgi/unix/1009715036/l50
61 :nobodyさん :02/03/11 21:08 ID:Jt12j7IU.net namazuの検索、なんか使いにくいんだけど。。 変に文節で区切らずに、googleみたいに普通に検索してくれたら それでいいのに。。
62 :nobodyさん :02/03/11 23:50 ID:???.net >>61 うん。
63 :nobodyさん :02/03/12 07:59 ID:qMnzd5b/.net >>61 これのこと? >日本語がでたらめにわかち書きされてしまう >{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、 >でたらめにわかち書きされることがあります。 >これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。 >検索はあきらめましょう。 それとも、インデックス作るときの分かち書きをしないでほしい、ってこと? それって実現できるのか?
64 :nobodyさん :02/03/18 17:35 ID:???.net googleはユーザーにあまり意識させないだけで、分けて探してるよ
65 :nobodyさん :02/03/19 11:29 ID:ulLvfL7+.net googleわけてるかな? 日本語は解析していないように見えるけど…。 英語はスペースでわけるだけだから楽だね。 それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。 つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。 ローカルでほしい、、
66 :nobodyさん :02/03/19 12:54 ID:TPtrOTqR.net >>65 googleも分かち書きしてるらしい、という実験結果がある。 検索エンジンのしくみ教えます http://www.google.com/search?hl=ja&ie=Shift_JIS&oe=Shift_JIS&q=cache%3AALmw0POy8V4C%3Awww.mars.sphere.ne.jp%2Fengine%2Fchap_g1.htm+site%3Awww.mars.sphere.ne.jphl%3Dja+Google&lr=lang_ja なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。
67 :nobodyさん :02/03/19 14:31 ID:???.net >>66 さん、ありがとうございます。 ほんとだ。分かち書きしてる、、 うむ、googleはちゃんと各言語ごとにチューンしてるんですね。
68 :nobodyさん :02/03/19 15:32 ID:TPtrOTqR.net 逆に言えば、分かち書きエンジンの精度さえ向上させれば、 google並みのことはできるってことだよね (もちろん、PageRank とかは抜きにして)。 いつも kakasi だけど、Chasen を使ってみようかなあ・・・。
69 :nobodyさん :02/03/19 15:52 ID:???.net 個人で使うような件数の多寡が知れているようなシステムだったら、純粋に全件マッチ検索の方が便利だよね。
70 :nobodyさん :02/03/19 20:25 ID:???.net >>68 googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ) なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。 ヒット数が少ない場合、関係ないけど。
71 :nobodyさん :02/03/19 20:38 ID:???.net >>70 その点は激しく同意。 ただ、分かち書きの精度を上げることで、 >>61 のやりたいことは実現できるんじゃないかな、って思った。
72 :nobodyさん :02/04/24 13:48 ID:???.net (´_ゝ`)フーン
73 :ato :02/05/09 14:31 ID:8gc3nIf4.net Namazu使ったPDFの全文検索でページしていとかできますか?
74 :nobodyさん :02/05/10 00:55 ID:???.net Namazu使ったJPGの全文検索でページしていとかできますか?
75 :nobodyさん :02/05/10 02:55 ID:???.net >>70 いまさらだが、NamazuへのPageRankの実装は、この論文が有名。 http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
76 :nobodyさん :02/05/10 07:02 ID:???.net >>75 まだ、このスレが生きていたとはね 興味深い文章サンクス。 改めて深入りできない、しちゃいけない分野だと再確認したよ
77 :nobodyさん :02/05/10 20:41 ID:???.net 77ゲットオォォォォ!!  ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄ (´´ ∧∧ ) (´⌒(´ ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡  ̄ ̄ (´⌒(´⌒;; ズザーーーーーッ
78 :nobodyさん :02/05/24 03:19 ID:???.net (・∀・)イイ!
79 :nobodyさん :02/05/27 19:51 ID:LrpMVRit.net 類似スレッド WWW検索エンジンサイト http://pc.2ch.net/test/read.cgi/esite/973436559/l50
80 :nobodyさん :02/06/06 04:44 ID:jW1FwXu2.net ひさしぶり!
81 :nobodyさん :02/06/09 00:21 ID:MvwsaEnI.net コレ、namazuの対抗馬になれるか? http://freshmeat.net/projects/snatcher/
82 :山拓変態問題 :02/06/20 09:30 ID:???.net mp3用のフィルタって誰か書いてないかしら?
83 :nobodyさん :02/06/20 09:39 ID:updula6F.net Namazuでmp3用のフィルタ??? わからん、俺がアフォなだけか?
84 :nobodyさん :02/06/20 12:41 ID:0pQ6ektu.net >>82 ID3タグでも検索するのか? そういうのは ふつー DB 使うだろ。
85 :山拓変態問題 :02/06/20 15:09 ID:???.net >>83-84 自分のホームヂレクトリをクロンで毎晩なめてるんだけど、 どうせなら、ID3も見てくれないかなと。 変かなぁ。
86 :82=85 :02/06/20 15:34 ID:???.net って、WEBプログラミングとは、違いますな。 スレ違いスマソ。
87 :nobodyさん :02/06/25 01:01 ID:cgKxt6dS.net >>86 なるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、 検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。 やってることは google のイメージ検索みたいな感じかな。 perl でサクッと書けそうな雰囲気。 ぜひトライしてみて。 あと、Web プログラミングとは関係ないけど、 Namazu に関係あればいいと思うよ。
88 :nobodyさん :02/06/25 02:46 ID:???.net いや、それをWebから使えるようにすりゃWebプログラミングと むちゃくちゃ関係あるじゃん。 > やってることは google のイメージ検索みたいな感じかな。 イメージ検索は外部から関連性を持ってくるのでちと違うような。 内部のID3だけだったらPDF検索くらいに対応するだろう。 ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら やっぱり便利かも。
89 :nobodyさん :02/08/12 22:58 ID:???.net うなぎ食べたいね。
90 :nobodyさん :02/09/02 23:28 ID:???.net ナマズマズー
91 :nobodyさん :02/09/20 08:19 ID:???.net ウマー
92 :nobody :02/09/21 15:05 ID:???.net 検索結果で表示されるファイルの先頭部分のサイズを変更できますか? やりかたを教えて下さい。
93 :nobodyさん :02/09/25 08:37 ID:3VOnIdJA.net wget でURLテキスト-iで、ディレクトリ作成-x しながらページ拾ってくると、 稀にディレクトリ作成(www.aaa.xxx)されなくて 関係ないディレクトリ(www.bbb.xxx)にページを 格納してしまいます。 このままindex作るとURLリンクが関係ないところに。 どうしてだろう。困った。
94 :nobodyさん :02/09/27 20:30 ID:7S/gcFrV.net Office XPファイルは、インデキシングできないのかなぁ。
95 :nobodyさん :02/09/28 02:50 ID:gf1ROtiY.net @ノハ@ ピュー( ‘ д‘) =〔~∪ ̄ ̄〕 =◎−−◎
96 :名無しさん@お腹いっぱい。 :02/10/07 17:04 ID:ucR8g7pl.net @ハヽ@ (' д ‘)ピュー 〔~∪ ̄ ̄〕= ◎−−◎= づかれたゾイ
97 :名無しさん@お腹いっぱい。 :02/10/07 17:05 ID:ucR8g7pl.net ↑車輪がずれたゾイ
98 :nobodyさん :02/11/02 15:20 ID:Jwe6TBuD.net ウマー
99 :Windows における namazu w/chasen :02/11/03 10:47 ID:rQsphwgx.net Chasen を使ったインデックス作成が出来ません http://www.namazu.org/ml/namazu-win32-users-ja/msg00671.html http://www.namazu.org/ml/namazu-win32-users-ja/msg00672.html http://www.namazu.org/ml/namazu-win32-users-ja/msg00692.html を見ると、2001/05 時点で chasen を使ったインデックス作成は cygwin 環境で行うことができるようですが、 現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?
100 :Windows における namazu w/chasen :02/11/03 11:17 ID:???.net >>99 Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。
101 :Windows における namazu w/chasen :02/11/03 11:33 ID:???.net Namazu 2.0.12 は cygwin 上で問題なくコンパイルできました。 cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、 CPAN http://search.cpan.org/dist/File-MMagic/ からダウンロードしてきて あらかじめ (configure の前に) インストールしておく必要があります。
102 :Windows における namazu w/chasen :02/11/03 14:10 ID:rQsphwgx.net namazu + chasen は cygwin で 問題なく動きました。 cygwin のコアDLLのバージョンは 1.3.14-1 です。
103 :nobodyさん :02/11/03 23:09 ID:sdt4YScv.net >>99 全部cygwinでやる方法以外無いのでは? そもそもkakasiを使う事が推奨されていて。 茶筅は結構イレギュラーな方法なわけだし。 (運用上結構問題がある)
104 :nobodyさん :02/12/03 00:32 ID:???.net ウマー
105 :nobodyさん :02/12/26 00:21 ID:DUegdvZH.net namazuを2chのdat形式に対応させようとしている人っていますか? 形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。 ファイル名と行数だけ教えてくればそれでよいんですが。 Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、 車輪の再発明になりそうで中断してる。
106 :nobodyさん :02/12/26 00:41 ID:M1+zinp+.net >>105 dat からそのままインデックスを作りたいってこと? mknmz 用のフィルタを書けばいいだけだよね。 perl だし結構簡単そうだね。
107 :nobodyさん :02/12/26 01:19 ID:DUegdvZH.net >>106 そのとおりっす。 各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、 mknmz --html-split -a hogohoge.dat でインデックスは作れたし、検索もできるのは分かるのですが、 mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。 html向けには分割して処理してるみたいですし。 誰か同じようなこと考えていないかなと。
108 :nobodyさん :02/12/26 01:48 ID:M1+zinp+.net >>107 read.cgi が出力する html をインデックスするよりも、 dat から直にインデックスする方がきっと速い。 いちいち dat から html 作らないから、不要なファイルを作らなくてもよい。 html として出力するのは 2ch ビューアとか、read.cgi に一任できる。 利点はこのあたりかな。みみずんとか喜びそうだよね。 結局、mknmz の仕様に則ったフィルタを作ればいい。 html.pl とか参考にして作ってみたら? http://cvs.namazu.org/namazu/filter/html.pl?rev=1.34&content-type=text/vnd.viewcvs-markup もし実現できたら、cvs にある scheme/http.pl と組み合わせて、 2ch.net の dat を直接インデックスできるかな。 あ、今 2ch.net は dat 直読みできないんだっけ? だめか。
109 :nobodyさん :02/12/26 02:05 ID:DUegdvZH.net >>108 フィルタ自体はHTMLのでも十分なんですよ。 --html-splitなしでは、mknmzってファイル単位でしかインデックス作らないじゃないですか。 datってスレ毎で、全レスが入っているから、スレごとにしか検索できないことになってマズーなのです。 p2 ( http://pc.2ch.net/test/read.cgi/mac/1034199997/ )のdatを2次利用したいなと思っていろいろ試してます。 >>107 に書いたように、mknmzのprocess_fileあたりの--html-split処理部を書き換えてみてます。
110 :nobodyさん :03/01/02 18:30 ID:cP1MLYPA.net >>109 --html-split的なファイル分割を実現している人がいます。 本家には全く取り込まれていませんが… Emacsのinfoファイルの分割(X-ml-name: namazu-devel-ja X-mail-count: 02059 ) http://www.namazu.org/ml/namazu-devel-ja/msg02063.html PDFファイルをページごとに分割(X-ml-name: namazu-devel-ja X-mail-count: 01951) http://www.namazu.org/ml/namazu-devel-ja/msg01950.html つーかどちらも実装したのは僕ですが… 実現は単純だと思います。 行ごとにsplitするだけでとりあえずは実装できると思います。 見やすいようにフィールド情報を与えるためにはちょっと工夫がいるかもしれません。 ただフィールド情報が無くても十分有用だと思います。 そのページだけじゃわかりづらいと思うのでわからなかったら質問してください。 navi2chやら他の2ちゃんねるブラウザと連携すれば便利かもしれません。 ある特定のスレだけを検索対象にしてwebに公開しても便利かもしれません。
111 :nobodyさん :03/01/03 09:06 ID:???.net 管理の都合上、 すべてのページについて、php4とpostgresを使っていて、 URLは http://domain.com/foo/?category=bar の形式で作ってるんですが (fooとbarはいろいろ変わる&postgresでページの階層構造を管理してる) これにNamazuを導入するには、どうすればいいんでしょうか・・・?
112 :nobodyさん :03/01/03 09:29 ID:v/h8n2uJ.net
113 :111 :03/01/03 18:29 ID:lPX3I1sa.net あーれー、レスがない。
114 :nobodyさん :03/01/03 18:42 ID:???.net >>113 そういうこと書くと逆効果。大体お正月で人いないし。 そうだなあ、来週の金曜までにレスが無かったら、私がレスするよ。
115 :nobodyさん :03/01/03 18:49 ID:???.net >>113 この板でたかだか9時間くらいで何をいってるんだか。 再来週の木曜日までにレスがなかったら俺がレスするよ。
116 :111 :03/01/04 00:23 ID:U6dtWDEb.net とりあえず、それまでに、自学でなんとかできるかできないかなでの段階に、 ・・・いきたいな
117 :111 :03/01/04 19:17 ID:BatkqzbV.net 検索にひっかからない。。。 「php namazu インデクサ」とじゃ 「php namazu シェルスクリプト」とかで検索してるんだけど、 いまいち該当しない。 検索のヒント、ください。
118 :111 :03/01/11 17:11 ID:CeP+V+mb.net ショボーン
119 :nobodyさん :03/01/11 18:22 ID:8y79ZXZ4.net namazuかぁ。 ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。 kakasiにひらがな単語の辞書登録さえあれば…。 もともと、そーゆープログラムではないから AQに採用されることないけど。
120 :山崎渉 :03/01/15 13:33 ID:???.net (^^)
121 :nobodyさん :03/01/17 16:56 ID:TsHzDgv8.net >>119 茶筅にしる!
122 :nobodyさん :03/01/18 02:26 ID:???.net Googleみたいにヒットした単語の周囲の文章をサマリ表示させてほしい。 サマリは直接生成。
123 :nobodyさん :03/01/18 07:01 ID:0IdKnMy1.net ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。
124 :nobodyさん :03/01/18 15:04 ID:???.net >>123 あらかじめ検索用のインデックスを作っておいて、javascriptで、〜〜〜〜
125 :124 :03/01/18 15:07 ID:???.net よく考えたら、自分の所でCGI使えなくても、 CGIを使えるサーバーを借りたら、解決だった。
126 :nobodyさん :03/01/18 16:10 ID:???.net >>122 pnamazuつかえ
127 :nobodyさん :03/01/18 22:45 ID:KC3+f7J6.net >>122 自分的にもそれは必須の機能だと思うんだけどなぁ。 頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。 メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。
128 :nobodyさん :03/01/21 15:04 ID:2m91wCEm.net 、、、すんません 教えて下さい。 Namazu 2.0.12 for Win32をWin98で使用しています。 mknmzを実行すると、下記のエラーが出てしまいます、、、 Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/ lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34. BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34. お分かりになる方、いらっしゃっいましたら ご教授ください。お願いします!
129 :nobodyさん :03/01/21 23:04 ID:???.net MMagic が適切なパスにないか、インストールしていない。
130 :nobodyさん :03/01/22 00:18 ID:???.net >129さん 早速のレス、ありがとうございます。 MMagicのインストールを行おうとすると、エラーがでるので確かにインストール されていないようです。 namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが 私のActivePerlのビルド番号を確認すると、804となっています、、、。 これが原因なんでしょうか?
131 :nobodyさん :03/01/22 22:49 ID:tlaGPNPQ.net kabayaki使えYO!
132 :nobodyさん :03/01/22 22:55 ID:0SY2SNoc.net 「パソコンの仕組み」 http://pc1.moo.jp パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。 ガンガン、アクセスしてください!!
133 :nobodyさん :03/01/22 23:06 ID:DuSjMjDY.net 小遣い稼ぎ http://banana.fruitmail.net/cgi/introduce_jump2.cgi?1363289
134 :nobodyさん :03/01/23 09:19 ID:XTkiyicl.net chasen使ってる人に質問です。 やっぱりkakasiより検索精度あがりますか? とくにひらがな単語やカタカナ単語で。
135 :nobodyさん :03/01/24 13:46 ID:DnlSMTjH.net おまいら、namazuで検索するファイル数ってどのくらいですか? 1ディレクトリで1000ファイルオーバーとかって、インデックス 作るのに問題ないっぽい? なんか、毎日自動でインデックス作ってるんだけど、ちゃんと インデックス作れてない(検索できない)場合が時々あるのよ。手動で 作ってやるとちゃんと動くところがまた憎らしい。
136 :nobodyさん :03/01/24 15:43 ID:9aIuMK5X.net wgetの収集でたまにぜんぜん関係ないディレクトリに index.htmが格納されて困るんだけどなんでだろう。 ブラウザ動かしながらやるとミスするのかなぁ。 win2k
137 :nobodyさん :03/01/25 15:38 ID:x6YUG/OM.net pnamazuのほうがヒットしやすいのでしょうか? perl版でインデックス作らないとダメなのでしょうか? そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?
138 :nobodyさん :03/02/05 04:47 ID:vQpd3y9f.net 保守
139 :nobodyさん :03/02/05 06:56 ID:CehyN38W.net http://homepage3.nifty.com/digikei/ten.html いいね〜 これ♪
140 :nobodyさん :03/02/05 09:04 ID:LQrwCDVW.net アダルトの宣伝↑ ナマズの派生で、カバヤキっていうのでたけど使ってる人いる?
141 :nobodyさん :03/02/05 09:11 ID:JiOCwoo3.net http://www.agemasukudasai.com/bloom/
142 :nobodyさん :03/02/05 10:12 ID:???.net 初めて Namazu 使ってみたけど、SI には使いづらい作りだな…
143 :nobodyさん :03/02/05 11:27 ID:???.net >>142 どこら辺が? 内容によっては、回避策や運用のテクニック教えてあげられるかも。
144 :nobodyさん :03/02/07 03:32 ID:/4XUF2iq.net MS-Access + ASP の like による全文検索と Namaz でインデックス 作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー 検索対象レコード:1000、検索対象フィールド:3 各フィールド60,000文字ぐらいで考えてるんだけど、 MS-Access + ASP じゃ無理あるかな・・・ 2、3秒で検索結果がでてくればいいのですが・・・ インデックスの作成自体、最近気づいた愚か者ですが、 よろしくお願いいたします m(_ _)m
145 :nobodyさん :03/02/07 06:28 ID:KeFGYCTZ.net http://jsweb.muvc.net/index.html ?????????
146 :nobodyさん :03/03/07 18:19 ID:+bpjK8Vp.net UNAGI
147 :nobodyさん :03/03/08 13:01 ID:???.net Namazuが装備されてるレン鯖なら http://www.akira.ne.jp/index.htm
148 :nobodyさん :03/03/08 16:11 ID:6pWNtujS.net あるファイルを処理できるフィルターが複数あるとき、 どちらを使うかはどうやって決まるのでしょうか?
149 :山崎渉 :03/03/13 17:05 ID:???.net (^^)
150 :nobodyさん :03/03/13 20:02 ID:???.net (・∀・)イイ!
151 :nobody :03/03/28 00:40 ID:???.net (´-`).。oO(保守……。)
152 :山崎渉 :03/04/17 12:25 ID:???.net (^^)
153 :山崎渉 :03/04/20 06:08 ID:???.net ∧_∧ ( ^^ )< ぬるぽ(^^)
154 :nobodyさん :03/04/23 13:38 ID:???.net うちのノートPC、2chのlog数百個程度mknmzしてると CPU周り熱々になって九割方落ちる鬱
155 :nobodyさん :03/04/28 11:08 ID:???.net レン鯖レン鯖
156 :nobodyさん :03/05/14 16:15 ID:???.net (・∀・)
157 :nobodyさん :03/05/18 02:04 ID:inHKtSNs.net Namazuを使ってます。 ただ、データの量が多くインデックス作成に失敗する事が多々あり、 現在は分割して、インデックスを作成。 ここに追加( --no-delete オプション)しています。 (更新は週に1回でも十分なので、本当は週に1回最初からインデックスを 作り直したいのですが、時間的にも労力的に厳しいです) 質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに 追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの 削除は可能でしょうか?
158 :nobodyさん :03/05/18 10:06 ID:OMFaVw9A.net >>157 >データの量が多くインデックス作成に失敗する事が多々あり うちではそんなこと無いなあ。まあ10万ファイル程度だけど。 データ量が多いってどのくらい? インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?
159 :nobodyさん :03/05/18 14:25 ID:???.net >>158 共用サーバにてインデックスを作成、Namazuを利用しています。 おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。 メッセージは「Out of Memory!」です。
160 :nobodyさん :03/05/18 17:53 ID:???.net ローカルのマシンでインデックスを作ってアップロードじゃだめなん?
161 :nobodyさん :03/05/19 02:54 ID:???.net >>160 それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね? 現在はReplaceで、サーバのパス/virtual/ID/→http:// 〜の絶対パスに変更しています。 ローカル(Windowsマシン)C:\〜を絶対パスhttp:// 〜に変更させる事ができるのでしょうか?
162 :nobodyさん :03/05/19 08:52 ID:???.net >>161 だって自分でやってるって書いてんじゃん。
163 :nobodyさん :03/05/19 11:12 ID:???.net なんだ、結局サーバのメモリ使用量制限に引っかかってるだけじゃん。 Namazu と直接関係ないじゃん。 >>161 可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ? ml の過去ログで似たような事例を見た気がする。
164 :nobodyさん :03/05/19 12:36 ID:R1nWpNfc.net NamazuってリレーショナルデータベースのIndex検索できますか? Javaで書かれたLuceneってのはできますよ。
165 :動画直リン :03/05/19 13:08 ID:IEVyzYan.net http://homepage.mac.com/hitomi18/
166 :nobodyさん :03/05/19 14:26 ID:???.net >>162 >>163 ありがとうございます。 wget>インデックス作成>検索と3段階で相当な負荷が サーバにかかっていたので、いつアカウントを止められるのか 心配していました。 wget>インデックス作成まで行えれば、 検索だけをサーバで行うので負荷も和らげられると思います。
167 :nobodyさん :03/05/19 15:01 ID:hryn2RRe.net (;´Д`)ハァハァ http://homepage3.nifty.com/coco-nut/
168 :bloom :03/05/19 15:08 ID:IEVyzYan.net http://homepage.mac.com/ayaya16/
169 :nobodyさん :03/05/21 10:19 ID:???.net ローカルのWindowsのNamazuと、共用サーバのLinuxのNamazuのインデックスは 互換性があるのでしょうか?
170 :nobodyさん :03/05/21 14:38 ID:zDb/UTki.net age
171 :bloom :03/05/21 15:08 ID:JZ9K0e/X.net http://homepage.mac.com/ayaya16/
172 :nobodyさん :03/05/22 00:10 ID:???.net >>169 あるよ。
173 :nobodyさん :03/05/22 01:10 ID:???.net >>172 ありがとうございます。 Liunxのインストールからはじめるのは辛いですし、 cgiでインデックスを作ろうとするとすぐに落ちるので 助かりました
174 :山崎渉 :03/05/22 01:58 ID:???.net ━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―
175 :nobodyさん :03/05/23 00:35 ID:???.net (・∀・)
176 :山崎渉 :03/05/28 17:21 ID:???.net ∧_∧ ピュ.ー ( ^^ ) <これからも僕を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉
177 :nobodyさん :03/05/30 16:43 ID:???.net (・∀・)
178 :nobodyさん :03/06/18 16:39 ID:DT1VWY3V.net そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?
179 :nobodyさん :03/06/18 22:37 ID:yFwDTAK+.net >そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか? PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事 nkfを利用しているからじゃないかな
180 :nobodyさん :03/06/19 00:34 ID:r/KT2iM+.net nkf使ってないよ、lvでutf8対応している
181 :nobodyさん :03/06/25 14:23 ID:77oj5Ix9.net Namazuってファイルの検索に使うんですか? 全文検索できないの? できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能? また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな? Windowsマシン上にあるファイルもさがせたりしないんでしょーか。 いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか
182 :nobodyさん :03/06/25 15:10 ID:vaUG6cj5.net ☆覗いてみてください☆(閲覧無料) http://endou.kir.jp/yuminet/link.html
183 :_ :03/06/25 15:12 ID:???.net http://homepage.mac.com/hiroyuki44/
184 :ミルフィーユ :03/06/25 15:24 ID:???.net カスケードスタイルシートって、 おいしそうですねぇ。
185 :nobodyさん :03/06/25 19:36 ID:???.net >>181 no no no no no 調べ方悪すぎ。namazu.orgにある文章読むだけで全て分かるのに。
186 :181 :03/06/27 00:27 ID:6z/IvjGb.net >>185 noってそれぞれの私の質問に対する回答ですか? いずれにしてもサンクス子 http://www.namazu.org/ いってきます。。m(。_。)m
187 :??? :03/06/27 19:27 ID:1V/886pX.net インデックスの作成 OK → Webサーバーへのアップ OK →キーワード入力 OK →検索している 検索結果は出るのですが 全く関係のないページばかりリストアップ。そのページソースを検索キーワード で探してもありません。 インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を お願いします。
188 :nobodyさん :03/06/28 01:23 ID:???.net >>187 Namazuってそんなもんだよ。 といいつつ、おれもインスコしてますが、自分では一切使わない。w
189 :187 :03/06/30 07:16 ID:???.net >>188 んっ〜それにしても結果が全く関係なさ過ぎるんですよ。 インデックスがまともに出来ていないような現象です。 ただ、作業的には問題なく進んでるんですよ・・・トホホ 。・゚(/д\)゚・。
190 : ◆MiMIZUNCjA :03/07/07 03:25 ID:sv7ydGsI.net なんどもインデックスの構築をしているといつのまにかめちゃくちゃな回答をされるときがあって そういう場合は最初から作り直しますがなんなんでしょうね。
191 : :03/07/07 03:54 ID:???.net >186 たぶん回答じゃなくて、ガイジンさんなんだよ。 ...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!! って感じだと思う。
192 :山崎 渉 :03/08/15 22:47 ID:???.net (⌒V⌒) │ ^ ^ │<これからも僕を応援して下さいね(^^)。 ⊂| |つ (_)(_) 山崎パン
193 :nobodyさん :03/10/02 14:51 ID:???.net no
194 :nobodyさん :03/10/06 00:26 ID:MvGVNeyO.net なんだか自分は複数indexについてよくわかっていません。 複数indexを作る場合、 namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか? 今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。 これだと、二つ以上のindexは作れないみたいです。
195 :nobodyさん :03/10/06 00:33 ID:???.net 複数インデックスは、 インデックスのあるディレクトリ内のサブディレクトリ名が そのままインデクス名になる。使う場合は、.namzurcではなくて NMZ.head.jaで idxname="foo" とか指定してやればいい。
196 :nobodyさん :03/10/06 06:50 ID:fxmWtj2Y.net >>195 わかりやすいレスありがとうございます。 解決しました。
197 :nobodyさん :03/11/13 08:37 ID:Tw9dU9HY.net 相談なんですけど、 「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ ないもんかな?」 という相談をうけますた。 う〜ん………… おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに 入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと root 権限なんか貰えないだろーしなぁ…… なんかいい方法ってないでしょか?
198 :nobodyさん :03/11/14 09:37 ID:???.net pnamazu
199 :197 :03/11/14 14:31 ID:bYphtnKK.net >>198 ありがとう!提案してみるよ って、これ、インデックス作成はローカルの環境でするのかぁ ま、いいや。相手がなんていうか、言うだけ言ってみよう ヒントくれてサンクス!
200 :nobodyさん :03/12/20 12:12 ID:BT5vMVU9.net 特定のディレクトリのみ除外する方法は何かありますか?
201 :nobodyさん :03/12/20 14:36 ID:???.net >>200 特定のファイル(拡張子だけだったかも)を除外する という設定項目があった様な記憶があるんで、 もしかしたら、それの応用でディレクトリごと無視するとかできるかも。 #具体的にどんな設定をするかは忘れた #多分namazuの本家サイト見たらあったよ
202 :nobodyさん :04/01/02 23:12 ID:???.net 自分のページは全て、「http://www.example/com/?cat= ★」★はページごとに違う という形式なのですが、 こういった動的なページに対してNamazuを使うというか、インデックスを作成するには、 どうすればいいのでしょうか?
203 :202 :04/01/02 23:13 ID:???.net もとい、 誤:「http://www.example/com/?cat= ★」 正:「http://www.example.com/?cat= ★」
204 :202 :04/01/04 01:18 ID:LkXOe+SC.net あ、すごいタイムラグあいてますね。。。age
205 :z33 :04/01/04 10:35 ID:???.net >>202 replaceでがんばってどうにかできないかな? 例えば /home/apache/documentroot/test/1.txt ↓ http://www.example.com/?cat=/test/1.txt って変換だったら Replace "/home/apache/documentroot" "http://www.example.com/?cat= " とか こういうこと?
206 :202 :04/01/05 22:28 ID:???.net >>205 ありがとうございます。 全部、/?cat=★は「★.inc」としてファイルをおいてあるので、それでなんとかいきそうです。
207 :nobodyさん :04/01/19 19:55 ID:daYuprPN.net 教えてもらいたいことがあるんですが nmz.field.**** の****を増やしたいのですが、どうしたら良いでしょうか? 具体的にはmknmz時にuriを見て wwwroot/aaa/a.html wwwroot/bbb/b.html nmz.field.locate ってファイルを作ると その中に aaa bbb って出力されてほしい で検索結果でyahooのカテゴリのように <a href="a.html">aのタイトル</a> カテゴリ TOP>>aaa(${locate}の値)とかやりたい まぁ検索結果の中でuri見て変換したら良いんだけど、 もうちっとスマートに処理させたいなと・・・
208 :z33 :04/01/20 22:20 ID:???.net >>207 ちょっとググッて探してみたら、こんなの見つけたけど http://www.namazu.org/ml/namazu-users-ja/msg02744.html 参考になる?
209 :nobodyさん :04/02/11 00:01 ID:???.net Namazuで検索サイトやろうかな。
210 :nobodyさん :04/02/13 03:38 ID:jCzy8g3E.net 質問です。 2chの過去ログを検索出来るようにしていますけど ファイル数17万程度でインデックス作成に取り組んでいるのですけど 3日経っても終わりません。。おかしいと思いこちらに来ました。 もっと処理を早くしたいのですが、、 一応何を書けばいいのかわかりませんが、 PCのスペック等を簡単にまず記します。 何か必要な設定項目を書けと言われればすぐ書きますので、、 CPU P3-1G@dual mem 1G namazu ver2.0.12 perl 5.6 設定ファイルの中身を弄ればいいのでしょうか。。 一応インデックス書き出しは行われ続けていますけど 遅くて遅くて、、、 何かヒント等くれる方いらっしゃいませんでしょうか、、、?
211 :210 :04/02/13 03:45 ID:jCzy8g3E.net OS windows2000 sp3 KAKASI使用 mknmzrc設定 $ON_MEMORY_MAX = 5000000; $FILE_SIZE_MAX = 10000000; $TEXT_SIZE_MAX = 1000000; $WORD_LENG_MAX = 128; $INVALID_LENG = 128; $MAX_FIELD_LENGTH = 200; $WAKATI = $KAKASI; とりあえずon memory maxの値が小さいのはわかったのですけど これが速さに関係するのかは理解出来ませんでした。 また、他に問題点や気づく点等がありましたら教えて欲しいです、、
212 :nobodyさん :04/02/13 08:37 ID:???.net 処理能力にはディスクI/Oという重要なファクターもある。 一気にmknmzするのではなく、分割してmknmz→マージする。 そうすれば処理時間もだいたい想像できる。
213 :210 :04/02/13 13:43 ID:wO1Lum8s.net >>212 ヒント有難う御座います! 少しそれについて調べてみます。
214 :森の妖精さん :04/02/16 02:31 ID:/mo58UcM.net http://geta.ex.nii.ac.jp/ GETAのPHPインタフェイス作ろうという奇特な御仁は いらっしゃいませんか?
215 :nobodyさん :04/02/20 12:32 ID:???.net 検索エンジン作成に関してのスレを こちらにまとめました。 検索エンジンをつくりたい http://pc2.2ch.net/test/read.cgi/php/1009030584/l50
216 :nobodyさん :04/03/24 21:59 ID:???.net これ誰かお願いします http://pc3.2ch.net/test/read.cgi/unix/1075033822/576 Java の API のリファレンスを Namazu でインデックス化していて Emacs でプログラミング中にカーソル上のクラス名ですぐ検索したいんです
217 :nobodyさん :04/03/31 21:28 ID:???.net Namazuでインデックス化をして検索をしようと思ったら 「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。 どうしてなのでしょうか。
218 :nobodyさん :04/03/31 21:46 ID:5e+SzBpf.net
219 :(´・ω・`) :04/04/01 21:05 ID:98Q5EoMa.net どなたかPHPスクリプトで動く 日本語全文検索エンジンソフトウェアを教えてください。
220 :nobodyさん :04/04/02 00:02 ID:n5mwBUCQ.net 4/1にNamazuの新バージョン出るんじゃなかったっけ?
221 :nobodyさん :04/04/02 22:28 ID:???.net
222 :nobodyさん :04/04/20 23:55 ID:hVBcQucn.net Namazu 2.0.13-1 を公開age
223 :nobodyさん :04/05/01 23:15 ID:HE2QfFBX.net kakasiについて質問です。 自分で作った辞書を、追加した。 # mkkanwa kanwadict (追加した辞書ファイル) 自分で追加した辞書の内容は、 上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、 現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか? kanwadictって、viで開くと文字化けして見れません。 ※環境:UNIX
224 :nobodyさん :04/05/27 15:51 ID:CEx1TsW7.net http://www.namazu.org/ にアクセス気出ません
225 :nobodyさん :04/05/27 16:43 ID:mtXfTMbY.net >>224 orz
226 :nobodyさん :04/05/27 16:43 ID:???.net 今見たら面白いことになってるな
227 :nobodyさん :04/05/27 16:57 ID:???.net >>224 何かあったの? クラックされてたとか?
228 :nobodyさん :04/05/27 19:56 ID:WJMdSqlX.net namazu.orgサーバに不正侵入、サービス停止 全文検索システム「Namazu」を配布するNamazu Projectは5月27日、 同プロジェクトのサーバが不正侵入を受けたと発表した。 http://headlines.yahoo.co.jp/hl?a=20040527-00000016-zdn_n-sci
229 :nobodyさん :04/05/28 21:23 ID:???.net マジかよ・・・
230 :nobodyさん :04/05/28 21:24 ID:???.net マジかよ・・・
231 :nobodyさん :04/05/28 21:26 ID:???.net マジかよ・・・
232 :nobodyさん :04/05/28 21:28 ID:???.net マジかよ・・・
233 :nobodyさん :04/05/28 21:29 ID:???.net マジかよ・・・
234 :nobodyさん :04/05/28 22:17 ID:???.net うわっ・・・5重に書き込んじまったよorz
235 :nobodyさん :04/05/29 00:22 ID:???.net >>229-233 今回の2ch不調で俺が見た多重で最高だw
236 :nobodyさん :04/05/29 19:09 ID:???.net >>235 8連投した神もいたぞ。
237 :nobodyさん :04/05/30 20:09 ID:WmFD3m1t.net Windowsバイナリは????
238 :nobodyさん :04/06/02 02:08 ID:???.net >>229-234 ワロタ
239 :nobodyさん :04/06/17 19:14 ID:KtXfrXmS.net 人がいないので話題をふってみる 検索結果について質問なんですけど ttp://www.kaiho.mlit.go.jp/cgi-bin/namazu.cgi?query=%8B%DF%8AC&max=20&result=normal&sort=score ↑こんな風に検索語句と該当箇所が赤く強調されるのってどうやるんですか? ttp://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?key=a&submit=%B8%A1%BA%F7%B3%AB%BB%CF%21&whence=0&max=20&format=long&whence=0&dbname=reiki 自分のは↑こんなふうに参照したページの上部しか表示されません。
240 :nobodyさん :04/06/17 21:45 ID:???.net 正常に赤強調されるけど? http://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?query=%B8%F2%CC%EE&whence=0&max=20&result=normal&sort=score&idxname=reiki NMZ.headにデフォルトで strong.keyword { color: Red; } あるから、 「ちゃんとしたキーワード」なら赤くなるハズ。
241 :nobodyさん :04/06/18 00:33 ID:???.net >>240 本当だ・・・キーワードの入れ方がまずかったようです。 自分のnamazuでやり直したらちゃんと表示されました。 無知で申し訳ありません。
242 :nobodyさん :04/06/28 15:24 ID:???.net Perl版Namazuをレン鯖に置いてみましたが、 全角文字で検索すると検索語が”%a5%d0%a5%”みたいな感じで文字化けします。 検索結果画面はきちんと表示されますが、検索文字列だけが化けています。 もう一回全角で検索すると文字化けが直ります。1回目だけ必ず文字化けします。 何が原因でしょうか?
243 :nobodyさん :04/06/28 15:25 ID:???.net ↑うわ、UNIX板に書くつもりだったのに間違えた ごめんなさい、無視してください。
244 :nobodyさん :04/07/16 18:31 ID:???.net 検索は問題なく出来るのですが、 ヒットしたファイルが日本語のファイル名だと、 ブラウザ上に表示されているファイル名を クリックしてもファイルをオープンしません。 検索対象ファイルの、 ファイル名が日本語でも対応してますか? ちなみにWindows版(2.0.12)です。
245 :nobodyさん :04/07/19 00:54 ID:???.net http://suwako.plala.jp/pukiwiki/index.php?%5B%5BPHP%A4%C7Namazu%5D%5D ↑ここ見てnamazuの全文検索システムのソースを入れてみたら 無事に検索は出来るんですが検索された先のリンクがなぜか全てnamazu.phpがある カレントディレクトリになってしまいます。 これはどうすれば対処することが出来ますかね?
246 :nobodyさん :04/07/19 12:51 ID:???.net .namazurc弄ればいんでない
247 :245 :04/07/22 13:31 ID:???.net namazurcの48行目にあるReplaceを参考サイトを見ながら いじってみましたがやはり結果は同じです。 一体どこがおかしいんだろう? 例えばnamazu.phpをC:\homeに置いたら 検索結果はちゃんと表示されるんですがリンクが全て namazu.phpを置いているディレクトリになってしまいます。(この場合はC:\home) 変えるべきところはnamazurcのReplaceのところとは思うんですが 何度変えても同じ結果になってしまいます。 どうすればちゃんとしたリンク先になってくれるかな? 参考にしたサイト↓ http://ponx.s5.xrea.com/hiki/ja/hiki.cgi?xrea_tdiary_namazu http://you-like.to/nekomimi/works/w2k20001110.html
248 :nobodyさん :04/07/22 14:11 ID:???.net >>247 何でだろうね?ところで自鯖でやってるの?
249 :nobodyさん :04/07/31 19:38 ID:???.net Replace A(インデックス作成時のパス) B(Aを置換したい文字列) だよね。ちゃんとそうなってる?
250 :nobodyさん :04/07/31 19:44 ID:???.net pnamazu.cgiの検索結果に表示される「著者」の欄がウザイのと、 この欄の ${author} が一体何を表示するのかがわからないので ソースを追跡してみたのですが自分には具体的に読み解くことができませんでした。 sub field_init { %FieldAlias = ( 'author' => 'from' , 'title' => 'subject' , 'url' => 'uri' , ); あたりまではなんとなく分かるんですが・・・ Perlのすごい人! だれか教えて!
251 :nobodyさん :04/08/02 08:46 ID:???.net 著者を消したいだけなら NMZ.result をいじったほうが早いよ。 著者がなにかを知りたいんだったらpnamazuではなく、mknmzのほうを解析するよろし。
252 :nobodyさん :04/08/12 09:03 ID:???.net .namazurcで Replace /index.html / Replace /C\|/namazu/nurupo/ http://hoehoe.ne.jp/~nurupo/ と、2つの置換を行いたいのですが、当然できません。 正規表現が使えるみたいなことが書いてありますが Replace /C\|/namazu/nurupo/(.+)/index.html http://hoehoe.ne.jp/~nurupo/$1/ では全てが http://hoehoe.ne.jp/~nurupo/$1/ にされてしまいます($1が展開されない) どうやればこの置換を実現できるのでしょうか?
253 :nobodyさん :04/08/12 09:05 ID:???.net む?もしかして$1じゃなくて\1なのか・・・?そうなのか・・・?
254 :nobodyさん :04/08/12 09:07 ID:???.net ああ・・・やっぱ\1でも駄目だ・・・いったいどうすれば・・・
255 :nobodyさん :04/08/21 22:26 ID:???.net Namazuの検索結果って、 全部ドキュメントの行頭あたりしか表示しないけど Googleみたいにマッチした前後の文章を表示できんの?
256 :nobodyさん :04/08/22 16:46 ID:???.net >>255 できない。 レスポンスを重視した結果、今の仕様になっていると思われる。
257 :nobodyさん :04/08/22 19:58 ID:???.net >>255 Googleっぽい動作が希望なら Estraier使ってみるとか
258 :nobodyさん :04/08/23 22:59 ID:???.net Estraier はNamazu ほど敷居は低くないよなぁ・・・ >>255 有りものの中でなら msearch がお勧め
259 :nobodyさん :04/08/24 01:13 ID:202RVh+S.net そういや微妙に商用はいってる2ちゃん検索もmsearch使ってるっぽいな。 http://find.2ch.net/
260 :nobodyさん :04/08/24 06:48 ID:???.net CGIで複数の基本インデックスの指定は不可? F:\index +aaa +001 +002 +003 +bbb +001 +002 +003 aaaとbbbを指定したいのだが… ぐぐたら無理ぽいな ttp://search.luky.org/vine-users.2/msg02960.html
261 :nobodyさん :04/08/24 19:02 ID:???.net 001とか002とかもインデックス? javascriptとかでチェックボックスをコントロールするとかじゃ駄目か。
262 :nobodyさん :04/08/24 22:09 ID:???.net 多分無理かな。以下のようにcccを指定する じゃダメ? F:\index +ccc +aaa +bbb
263 :nobodyさん :04/08/25 01:35 ID:???.net >>261-262 数字のフォルダがインデックスで大まかに分けてある。 やはり1つのフォルダ以下にインデックスの入ったフォルダを置くしかないのか。
264 :nobodyさん :04/11/11 11:45:47 ID:VoJd1QOh.net インデックスと結果表示をutf8でできないでしょうか…
265 :nobodyさん :04/11/23 11:20:19 ID:???.net 本家のperl版まだー?
266 :nobodyさん :04/11/26 13:50:33 ID:cbW9i0f7.net お聞きしたいのですが… wgetで落したHTMLファイルをNamazuで検索しています。 Namazuの検索結果の順番を自分で決めたいんですが、 NMZ.field.uriの順番をいじると全てのページがNOT FOUNDになってしまいます。 どなたかいい方法知りませんか?
267 :nobodyさん :04/11/26 14:41:22 ID:???.net インデックスの作成を速くする方法ないですか? namazuはcなのにmknmzはperlなのはどうして?
268 :nobodyさん :04/11/26 14:55:11 ID:???.net >>267 インデックスの作成を早くするには分散して作成してからマージすればよいかも。 namazuがcなのはcの方がリクエストの度にコンパイルがない分、早いから、 mknmzはインデックス作る時しか使わないので文字の操作が楽チンなPerlを・・・。 ちなみにpnamazuっていうPerlで書かれたnamazuもある。 たしか2chもread.cgiはCだけど、bbs.cgiはPerlだったと思う。 質問は一個ずつにしてね。
269 :nobodyさん :05/01/02 10:01:19 ID:Oo1G9Jag.net とりあえずローカルで動かそうと思ったんですが、どうしてもインストールが うまくいきません。 インデックスを作ろうとするとNKF.pmが無いといわれます。 PPM-INSTALL.BATを動かしてもうまくいきません。どうすればいいのでしょうか?
270 :269 :05/01/02 12:42:33 ID:???.net すいません、自己解決しました。
271 :nobodyさん :05/01/27 22:35:38 ID:muSCpH63.net 一日費やして何とかNamazuをサーバーでうごかせれるようになったレベルなんですが、これでñとかóのような外国語をブラウザから検索してみると激しく文字化けしてしまいます。 なんか改善する術ってありますでしょうか? 教えて誰かエロイ人!!
272 :nobodyさん :05/02/11 17:47:10 ID:LfkZHaha.net namazuのwin32版をインストールしたのですが、mknmzrcの$ALLOW_FILEのところで、 2行目以下のwordなどの設定が対応メディアタイプに反映されません。 2行目以下も#は外しているのですが…。 茶筌のところ#を残しているのですが、それもちょっと変かもです。 うまくいかない原因がわかる方どなたか教えてください。 読み込んだ設定ファイル: D:/namazu/etc/namazu/mknmzrc システム: MSWin32 Namazu: 2.0.12 Perl: 5.006001 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: chasen -j -F '%m ' わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.SJIS 言語: ja_JP.SJIS 文字コード: sjis CONFDIR: D:/namazu/etc/namazu LIBDIR: D:/namazu/share/namazu/pl FILTERDIR: D:/namazu/share/namazu/filter TEMPLATEDIR: D:/namazu/share/namazu/template 対応メディアタイプ: application/x-gzip message/news message/rfc822 text/hnf text/html text/html; x-type=mhonarc text/plain text/plain; x-type=rfc text/x-hdml
273 :nobodyさん :05/02/11 19:36:57 ID:???.net >>272 まず最新の2.0.14を使いましょう。 それと D:/namazu/etc/namazu/mknmzrc の$ALLOW_FILE のところを全行はりつけてよ。 どこの#を外したのか見てみないとわからんよ。
274 :272 :05/02/11 19:40:50 ID:???.net >>273 最新って言ってもベータ版らしいので…。 とりあえずこんな感じです。 # # This pattern specifies file names which will be targeted. # NOTE: It can be specified by --allow=regex option. # Do NOT use `$' or `^' anchors. # Case-insensitive. # $ALLOW_FILE =".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text "|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files "|.*\\.pdf|.*\\.ps" . # PDF, PostScript "|.*\\.tex|.*\\.dvi" . # TeX, DVI "|.*\\.rpm|.*\\.deb" . # RPM, DEB "|.*\\.doc|.*\\.xls|.*\\.ppt" . # Word, Excel, PowerPoint "|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8 "|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man
275 :nobodyさん :05/02/11 19:43:44 ID:???.net あれ?連続する半角スペースとタブが消えるのは2ちゃんの仕様でしたよね。
276 :nobodyさん :05/02/11 19:49:17 ID:???.net >>274 Windows版はβ版扱いになっていますが、 インストーラがβというだけで本体に問題はないですよ。 たぶんフィルタが必要としているMS-Word等の アプリケーションが入っていないのでしょう。 こちらのフィルタを使うとよいでしょう ttp://www.geocities.co.jp/SiliconValley-Oakland/8718/namazu/index.html
277 :nobodyさん :05/02/11 19:53:07 ID:???.net 関係ないが消えるのはタブだけ。
278 :272,274 :05/02/11 20:00:49 ID:???.net そういえば2.0.12は2002年か…。 Office2003だということもあるのかな。 拡張子だけで判断してるのではないんですか。 まずは最新版をインストールしてみます。 用事があって今日これからはできないので、うまくいかなかったらまた後日質問させてもらいます。 回答ありがとうございました。
279 :nobodyさん :05/03/10 15:52:52 ID:???.net Redhat9、namazu2.012にて全文検索システムを作成しています。 ページが増えてきたので階層ごとにインデックスを作成し階層ごとに検索ページを 作りたいと考えております。しかしインデックスファイルを作成しnamazuコマンドでは 検索できるのですがブラウザから http:// サーバIPアドレス/cgi-bin/namazu.cgi?idxname=aaaとすると allインデックスから検索されてしまいaaaインデックスから結果を表示してくれません。 aaaインデックスから結果を表示するにはどのようにするのでしょうか? ページの階層 /apache/htdocs/aaa /apache/htdocs/bbb /apache/htdocs/ccc インデックスの格納場所 /apache/cgi-bin/namazu/index/all /apache/cgi-bin/namazu/index/aaa index/all内のNMZ.head.ja <input type="hidden" name="idxname" value="all"> ←allに変更 <a href="{cgi}?idxname=all">[検索方法]</a> ←?idxname=allを追加 index/aaa内のNMZ.head.ja <input type="hidden" name="idxname" value="aaa"> ←aaaに変更 <a href="{cgi}?idxname=aaa">[検索方法]</a> ←?idxname=aaaを追加 cgi-bin内にある.namazurc Index /apache/cgi-bin/namazu/index Template /apache/cgi-bin/namazu/index/all Replace /apache/htdocs/ http:// サーバIPアドレス/
280 :nobodyさん :05/03/10 22:40:21 ID:???.net >>279 mknmzの内容教えれ
281 :279 :05/03/11 09:08:13 ID:???.net ご返答ありがとうございます。mknmzの結果は下記の通りです。 mknmz -O /apache/cgi-bin/namazu/index/all /apache/htdocs 合計の文書数 602 合計キーワード 5,499 わかち書き module_kakasi -ieuc -oeuc -w mknmz -O /apache/cgi-bin/namazu/index/aaa /apache/htdocs/aaa 合計の文書数 9 合計キーワード 441 わかち書き module_kakasi -ieuc -oeuc -w よろしくお願いします。
282 :279 :05/03/11 16:15:26 ID:8QvGuHRh.net こっちですね。 KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: no わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /etc/namazu LIBDIR: /usr/share/namazu/pl FILTERDIR: /usr/share/namazu/filter TEMPLATEDIR: /usr/share/namazu/template 対応メディアタイプ: application/pdf application/x-bzip2 application/x-compress application/x-gzip application/x-rpm message/news message/rfc822 text/hnf text/html text/html; x-type=mhonarc text/plain text/plain; xtype=rfc text/x-hdml text/x-roff
283 :279 :05/03/11 16:20:49 ID:???.net すいません。間違えました。 mknmz -C 読み込んだ設定ファイル: /etc/namazu/mknmzrc システム: linux Namazu: 2.0.12 Perl: 5.008 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: no わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /etc/namazu LIBDIR: /usr/share/namazu/pl FILTERDIR: /usr/share/namazu/filter TEMPLATEDIR: /usr/share/namazu/template 対応メディアタイプ: application/pdf application/x-bzip2 application/x-compress application/x-gzip application/x-rpm message/news message/rfc822 text/hnf text/html text/html; x-type=mhonarc text/plain text/plain; xtype=rfc text/x-hdml text/x-roff
284 :nobodyさん :05/03/12 00:24:13 ID:???.net >>279 Template /apache/cgi-bin/namazu/index/all としているから 常に index/all内のNMZ.head.ja が読み込まれているということでないか namazurcのTemplateの行をコメントアウトしてみたら
285 :nobodyさん :05/03/17 23:30:42 ID:???.net >>279 亀レスだけど、 Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。 きちんとhiddenとかから送らないと。
286 :nobodyさん :2005/03/22(火) 21:53:42 ID:???.net >>285 それってどこでNGにしてるんでしょ。Namazu本体じゃなくて pnamazuとかインターフェースのところでやってるんですよね。
287 :279 :2005/03/30(水) 18:10:10 ID:???.net >>284-286 ありがとうございます。 検証が遅くなり申し訳ありませんでした。 サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。 ご教授ありがとうございました。 しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが ヘッダーの部分がallのもので表示されてしまいます。 (現在602 の文書がインデックス化され5,499 個のキーワード) 検索結果ページから再検索するとあるはずのページでも検索できません。 (allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?) namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが 表示されてしまいます。 複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?
288 :nobodyさん :2005/03/31(木) 00:35:45 ID:???.net >>287 Templateが選択される順序は説明書にあるとおり http://www.namazu.org/doc/manual.html#form-idxnames 再検索をする際にWebブラウザで表示ページのソースを調べて どのNMZ.headが読み込まれているか確かめてはどうですか。
289 :nobodyさん :2005/11/11(金) 14:19:22 ID:lZiu1JMN.net 会社で鯰使うらしいので、オフィとか見てみました。 日本語全文検索ってほぼGoogleでカバーできてるのでは? Winではあまり普及していないらしいし、導入に面倒がありそうだし 今、敢えてNamazuで検索を作るうまみってなんですか?
290 :nobodyさん :2005/11/11(金) 20:34:38 ID:???.net んーどうだろう
291 :nobodyさん :2005/11/12(土) 23:40:29 ID:???.net Googleはイントラネット内も検索できるようになってんですかそうですか
292 :nobodyさん :2005/11/13(日) 06:11:00 ID:???.net >>289 イントラの情報を検索できること 検索結果画面をカスタマイズできること カテゴリ検索ができること 文書の最終更新日をファイルスタンプから識別できること
293 :nobodyさん :2005/11/13(日) 08:31:58 ID:???.net 今使うならnamazuじゃなくHyper Estraierにするな. 俺なら.
294 :nobodyさん :2005/11/13(日) 15:52:29 ID:???.net >>293 そのソフト最近人気らしいけど、Namazuに比べてどの辺が優れてるの
295 :nobodyさん :2005/11/14(月) 10:06:19 ID:???.net >>291-292 なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。 だんだん鯰の位置づけがおぼろげながらわかってきました。 どうもありがとうございます。
296 :nobodyさん :2005/11/14(月) 12:47:16 ID:???.net Namazuだったら正規表現も使えるんじゃない? あれは便利だお。
297 :nobodyさん :2005/11/14(月) 16:16:53 ID:???.net 正規表現はすばらしい
298 :nobodyさん :2005/11/16(水) 14:03:06 ID:???.net (i)←こういうやつ?<性器表現
299 :nobodyさん :2005/11/17(木) 13:26:17 ID:???.net 〃∩ ∧_∧ ⊂⌒( ・ω・) はいはいわろすわろす `ヽ_っ⌒/⌒c ⌒ ⌒
300 :nobodyさん :2005/11/18(金) 11:32:18 ID:ngwfG4IK.net namazuのなんかのバージョンで、検索指定した文が ハイライトされて、(そのページの上のほうからのテキストだけでなく) 検索された部分が表示されるというやるがあるらしいよ と先輩に言われたのですが、どこにありますか? あるいはカスタマイズで処理するもんなのですか? 教えてください。
301 :nobodyさん :2005/11/19(土) 03:18:32 ID:???.net >>300 EmphasisTags じゃなくて?
302 :nobodyさん :2005/11/21(月) 10:11:48 ID:T4fDN5+G.net >>301 ありがとうございます、調べてみます。(`・ω・´)ゝ
303 :nobodyさん :2005/11/21(月) 10:27:34 ID:T4fDN5+G.net やってみましたが、どうも指示されたものと違うようです。 たとえば文中にキーワードがヒットしても、プレビューで表示されるのは そのページの文頭から指定文字数分ですよね? それを、キーワードの該当部分前後をプレビューに表示させたい という話でした。
304 :nobodyさん :2005/11/25(金) 10:08:55 ID:???.net >>303 です。 指示者がEstraierと混同していた可能性大です。 自己解決しました。どうもありがとうございました。
305 :nobodyさん :2005/12/14(水) 20:47:34 ID:CwjBoKRv.net Namazu はPerlだけでしょうか? できればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。
306 :nobodyさん :2005/12/15(木) 02:53:07 ID:???.net >>305 ネタっすか っ[google]
307 :nobodyさん :2005/12/15(木) 05:07:22 ID:???.net >>305 Namazu自体はPerlじゃないし。
308 :nobodyさん :2005/12/16(金) 05:48:32 ID:+W2Wi6VX.net な、なんだとーこのこのー
309 :nobodyさん :2005/12/16(金) 11:56:00 ID:???.net Namazuと言えばみみずんの2ちゃんねる過去ログ全文検索システムだな。 って思ったら>>30 に書いてあった・・・
310 :nobodyさん :2006/01/16(月) 09:59:58 ID:rhuM8+qJ.net 現在phpから動的にページを生成して出力しているのですが、 このPHPから出来上がるページをnamazuで検索したいと思っています。 どのような手法がありますでしょうか?
311 :nobodyさん :2006/01/16(月) 11:43:50 ID:???.net その動的に出力してるやつを静的なHTMLとして書き出す。
312 :nobodyさん :2006/01/16(月) 13:00:54 ID:rhuM8+qJ.net 動的なページを静的HTMLとして書き出してインデックス化するような処理をnamazuの方で出来ますか? それとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか? なんとかコマンド一発で出来ませんかね?
313 :nobodyさん :2006/01/16(月) 17:28:20 ID:???.net wget -> namazu っていうシェルスクリプト書けば一発でしょ。
314 :nobodyさん :2006/01/16(月) 20:36:24 ID:???.net Namazuはファイルのインデキシングを行うのみ。 動的なページをインデックスするには http://pc8.2ch.net/test/read.cgi/unix/1113150661/116
315 :312 :2006/01/16(月) 20:44:28 ID:???.net >>311 さん >>313 さん >>314 さん 親切にありがとうございます。 よくわかりました。とりあえずwgetの方法を試してみようと思います。
316 :nobodyさん :2006/01/16(月) 22:22:45 ID:???.net wget!
317 :nobodyさん :2006/01/30(月) 18:45:25 ID:???.net キタ━━━(゚∀゚)━━━!!!!
318 :nobodyさん :2006/01/30(月) 21:42:38 ID:???.net 2006-01-29: Namazu 2.0.15 を公開 ISO-8859-* に関する文書の間違いを訂正 RedHat ソフトウェア namazu.spec の不必要なパッチは削除 File::MMagic 1.25 を同梱 MeCab の正式対応 mknmz に -b 及び --use-mecab オプションを追加 mknmz および namazu に --norc オプションを追加 mknmz に --decode-base64 オプションを追加 新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加 mknmzrc に MECAB, DENY_DDN を追加 ファイル名がDDN である時にスキップ。 日付フィールドによるソート機能の追加 nmzcat, nmzegrep コマンドの追加 フィルタの Windows 対応 (msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...) OLE コントロールフィルタ更新 QUERY_STRING の区切りに';' 使用可能 Perl版テストプログラム(pltests) を追加 各種バグフィックス
319 :nobodyさん :2006/01/31(火) 08:21:04 ID:???.net 1年9カ月ぶりなのね
320 :nobodyさん :2006/04/02(日) 12:56:16 ID:6BlopTUr.net http://www.namazu.org/ は、MacのSafariで見れないのは、なんか理由があるのかな?
321 :nobodyさん :2006/04/02(日) 13:02:03 ID:???.net >>320 http://www.namazu.org/index.html.ja ならOK Content-Locationヘッダをうまく扱えてないみたい。 他所ではちゃんとリダイレクトされるんだけど、namazu.orgではNG。なんでだろう?
322 :nobodyさん :2006/04/07(金) 19:28:41 ID:???.net Namazuをローカルサーバーに組み込みたいのですが 何のファイルをサーバーに送れば良いのか教えてください。
323 :nobodyさん :2006/05/16(火) 22:05:32 ID:A+ClptH/.net >>322 ttp://www.namazu.org/installation.html
324 :nobodyさん :2006/07/04(火) 21:14:27 ID:t84Vuxwj.net >305 PHPでnamazu検索??? こんなの?? ttp://www.c-boxs.net/PHP/NamaP/
325 :nobodyさん :2006/09/07(木) 22:19:16 ID:n616cZBc.net AN HTTPDとnamazuでLAN内のファイルサーバ全文検索システムを構築しました。 この勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど 良い文書フィルタはありませんか?
326 :nobodyさん :2006/09/07(木) 22:22:28 ID:???.net >>325 自分で作ったほうが出来がいいぞ
327 :nobodyさん :2006/09/08(金) 09:21:57 ID:???.net >>325 っていうか2ちゃんにどっぷりハマってるような 人間のクズは氏んだほうがいいぞ。 専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。
328 :nobodyさん :2006/09/08(金) 14:34:10 ID:???.net にくちゃんねる2号だろ
329 :325 :2006/09/08(金) 20:52:20 ID:???.net >>327 単なるナレッジ・マネジメント・システムの構築を目指してるだけですよ。 「おーこわ」って・・・なにを勘繰ってんですか
330 :nobodyさん :2006/09/29(金) 14:11:41 ID:MXN7wOzE.net namazuがN-gram対応
331 :nobodyさん :2006/09/29(金) 21:56:15 ID:???.net >>330 しないよ
332 :(^-^) ◆MONSOON/qo :2006/10/08(日) 05:28:42 ID:aDf/+h/t.net インディックス作成時に読み込む文字種を正規表現で指定できますか? 記号は除外するとかです
333 :(^-^) ◆MONSOON/qo :2006/10/08(日) 05:39:20 ID:aDf/+h/t.net 自己解決しました
334 :nobodyさん :2006/10/10(火) 01:41:58 ID:???.net >>333 http://pc8.2ch.net/test/read.cgi/unix/1113150661/195-197 マルチで「自己解決」とは笑わせてくれるな
335 :nobodyさん :2006/10/13(金) 09:24:55 ID:???.net こいつの検索判定明らかにおかしい。 何でもそうなのだが、部分一致ができない。 ファッキントッシュは、バカの使うOS を検索するとする 「ファッキン」で検索すると一致なし 「ファッキントッシュ バカ」 で検索しても一致せず 「ファッキントッシュはバカの使うOS」でやらないと一致しない。 まるでMSNの検索エンジンだ あれとまったく同じ
336 :nobodyさん :2006/10/13(金) 15:19:49 ID:???.net ファッキン!
337 :nobodyさん :2006/10/13(金) 20:45:51 ID:???.net >>335 HyperEstraier いれろよ。こっちの方が簡単だよ。 検索漏れもないし。
338 :nobodyさん :2006/10/14(土) 00:11:41 ID:???.net >>335 「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。 プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて 最後に改行して保存。 > まるでMSNの検索エンジンだ というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。 Hyper Estraierでももちろんヒット。 >>335 の環境がおかしいんじゃないのか?
339 :nobody :2006/10/25(水) 22:26:22 ID:J6B8Hktu.net Windows ,PHP5に対応したPHPのNamazuモジュールを使いたいのですが、 どうやってモジュールをインストールするのか良く分かりません。 よろしければ、手順を教えていただけないでしょうか?
340 :nobodyさん :2006/11/20(月) 17:03:35 ID:???.net >>339 PHPライセンスとGPLライセンスが衝突するので 自分でモジュールをコンパイルするしかないです。 www.mail-archive.com/namazu-users-ja@namazu.org/msg00374.html
341 :nobodyさん :2007/02/08(木) 12:03:48 ID:Mb2H3yQx.net 保守
342 :nobodyさん :2007/03/22(木) 22:02:22 ID:???.net Namazu用のWEBクローラはないの? あと、インデクサや検索エンジンの分散処理ってどうやるのですか? どっちもHyperEstraierでは標準で付属してるよね
343 :nobodyさん :2007/03/22(木) 23:21:03 ID:???.net ない
344 :nobodyさん :2007/03/22(木) 23:25:45 ID:???.net じゃメタ検索は? Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか ないの?
345 :nobodyさん :2007/03/23(金) 00:11:38 ID:???.net 検索結果をマージして使っている例もあるようだ ttp://www.hpcss.is.ritsumei.ac.jp/Essay/2005/thesis/pdf/ohsaki.pdf
346 :nobodyさん :2007/05/11(金) 16:16:19 ID:???.net windows版のnamazuでmknmzでイントラネット内の共有ディスクの インデックスを作ると、終了できてないと思われるwordやexcelの プロセスがガンガンできるんですけど解決方法はありますか?
347 :nobodyさん :2007/05/11(金) 23:54:36 ID:???.net xdoc2txt.exe を使え
348 :nobodyさん :2007/08/22(水) 06:00:29 ID:XEGA28iC.net インデクスの中から登録キーワードの一覧を取得したいのですが ファイルを開くことすらままなりませぬ(Cの知識皆無・・・ PerlかRubyからアクセスする方法を探してるんだけど 説明のあるページなどご存知の方いませんか?
349 :nobodyさん :2007/08/22(水) 21:34:30 ID:???.net >>348 www.namazu.org/doc/nmz.html.ja#w に書いてあるとおり単なるテキストファイルに 1行に1単語で書かれているだけ
350 :348 :2007/08/23(木) 00:04:33 ID:???.net >>349 このページは見ていませんでした。(トップページからリンクされてない?) 片っ端からファイルを見ていって、 開くことができたファイルの内容をチェックしていたんですが見落としてました。 ありがとうございました!
351 :nobodyさん :2008/02/20(水) 20:07:39 ID:fLDVdokd.net 100MB強のPDFをインデックス化しようとするとmknmzが動作を停止する。なんでだ。 mknmzrcには200MBまでを検索対象にするよう設定してるんだが。
352 :nobodyさん :2008/02/21(木) 22:15:05 ID:7VDtsl8S.net >>351 メモリじゃん?
353 :nobodyさん :2008/02/22(金) 01:51:00 ID:CRNkbfG6.net メモリか。xpdfは王様プログラミングで作ってあるのか。。
354 :nobodyさん :2008/03/27(木) 06:31:14 ID:???.net あえてNamazuを使いたいのであれば構わないけど、 良い子は「Hyper Estraier」を使いましょう。 http://pc11.2ch.net/test/read.cgi/unix/1176807372/l50
355 :sfOdHWpuZpBZYiqez :2008/06/13(金) 21:05:42 ID:???.net v2EQ8I <a href="http://npiriddqxmjg.com/ ">npiriddqxmjg</a>, [url=http://snsxeffarbil.com/]snsxeffarbil[/url], [link=http://pribjbixlijw.com/]pribjbixlijw[/link], http://qczemfzbhofm.com/
356 :nobodyさん :2008/07/19(土) 19:10:35 ID:Hdkv0asv.net 検索結果に出てくる数字が1000の区切りでカンマが入るのは止めようがありませんか? 「1000」が「1,000」と表示されないようにしたいのです。
357 :nobodyさん :2009/07/30(木) 06:41:54 ID:???.net 当方、急に鯖管理をする事になった者なのですが、 いきなりよく分からない壁に当たりましたので教えて下さい。 namazu自体よく分かりませんので、手探りでやっています。 色んなサイトを見て見た結果、とりあえずnamazu.cgiを 見てみないと始まらないようなのでftpでダウンロードしてみました。 ところが、namazu.cgiを開いたら文字化けが酷くて読めません。 使ってみたソフトはjeditx あとは、miです。 どうしてこういうことになったのでしょうか。 namazu.cgiが読めないとインデックスの更新もできない ようなので先に進めない、と思われるのですが、 どなたか読む方法をご教授下さい。
358 :nobodyさん :2009/07/31(金) 00:09:56 ID:???.net >>357 首を吊るか、辞表を書け。さもなきゃ、人を雇え。
359 :357 :2009/07/31(金) 01:45:58 ID:???.net その「雇っていた人」が降りたので、倅の自分に 無茶振りで回って来ました。なのでショッピングカート (詳細なcgi部分を除く)とサイトいじりまでくらいしか 分からないです。 namazu.cgi自体はおまけでついて来るものだということは 色んなサイトを見て雰囲気で今日分かりました。 そもそもnamazu自体は、レンタルサーバにインストール されているべきなのか、自分のpcにインストールされているべきなのか それも分かりません。とりあえず、コンソ−ルからftpで入って、 フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても 動かなかったので、namazuのインストール自体はサーバではなくて、 本体にすると言うことでしょうか?ネットを調べても 自サーバメインのチュートリアルが多くて困っています。 とりあえずインデックスを更新するだけで良いです。 そもそもいきなり分かる訳が無いので多くは望んでいません。 人名の間違い登録は流石に放置できないので、質問した次第です。 大真面目なので、申し訳ありませんがよろしくお願い致します。
360 :nobodyさん :2009/08/01(土) 00:19:11 ID:???.net >>359 ttp://www.amays.com/~mizusawa/namazu_kaisetu/
361 :nobodyさん :2009/08/06(木) 13:05:55 ID:???.net dxfフィルタを導入したかったのですが、ホームページからのリンクが切れてました。 dxf用フィルタはもう配布していないのでしょうか?
362 :nobodyさん :2010/08/12(木) 12:11:44 ID:XzX6VOe9.net 1年ぶりに上げてみる
363 :nobodyさん :2011/12/10(土) 02:14:28.72 ID:???.net さらに1年四ヶ月
364 :nobodyさん :2011/12/14(水) 21:07:04.55 ID:???.net 牛NASにpnamazu入れようとしたけどよくわからん
365 : 忍法帖【Lv=40,xxxPT】(2+0:8) 【24.8m】 電脳プリオン ◆3YKmpu7JR7Ic :2012/09/17(月) 23:00:05.28 ID:???.net ?PLT(12079) ∧_∧ ( ・∀・) 人 ガッ ( つ―-‐-‐-‐-‐-‐○ < >__Λ∩ 人 Y ノ. V`Д´)/ し(_) / ←>>153
366 :nobodyさん :2014/01/22(水) 21:41:46.61 ID:???.net ぬるぽ
367 :nobodyさん :2015/10/01(木) 01:05:10.45 ID:???.net Namazu全文検索システム
368 :nobodyさん :2017/08/06(日) 20:33:47.24 ID:???.net Namazu全文検索システム
369 :nobodyさん :2017/12/30(土) 12:37:01.47 ID:YhlYw6jg.net 誰でも簡単にネットで稼げる方法など 参考までに、 ⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。 グーグル検索⇒『半藤のブブイウイウレレ』 T97QMNLQDJ
370 :nobodyさん :2018/09/09(日) 18:19:14.30 ID:???.net ナマズとかWeb1.0時代の化石だな
371 :nobodyさん :2019/03/14(木) 14:11:13.65 ID:???.net なまずってたいしたことなかった
372 :nobodyさん :2020/02/11(火) 15:35:29.19 ID:???.net チエオクレのハゲの悲惨なツイッター https://twitter.com/aphonedollar ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑ この自称「ハゲ」とかいうチエオクレのブログが酷すぎる >「DesktopHE」 はWindows10に対応してないらしい はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!! ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ ■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■ チエオクレのハゲが、Javaの設定を失敗してるだけじゃねえか!!! 嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか! hatenaとかでまで、必死こいて大嘘をばらまいているんだが (deleted an unsolicited ad)
373 :nobodyさん :2021/01/24(日) 03:51:52.78 ID:6vLPbUCtA 「フリーランススタート」の掲載案件数、累計16万件を突破https://codezine.jp/article/detail/13393 「週3日・社員の6割以上」テレワーク、東京都が要請 ホテルをオフィス代わりに使うと、1カ月100万円補助https://www.itmedia.co.jp/business/articles/2101/08/news119.html 札幌市のテレワーク導入支援制度 想定上回る申請600件 追加で受け付け中https://www.hokkaido-np.co.jp/article/499531/ 最大45万円を支給!ギフトモール、本社移転および従業員のリモート環境整備を徹底サポートhttps://www.jiji.com/jc/article?k=000000015.000048025&g=prt 週半分以上の在宅勤務も可能!大日本印刷が人事制度刷新へhttps://newswitch.jp/p/25098 中小企業がテレワーク導入のために利用できる助成金や補助金の制度があるって知ってた?https://dime.jp/genre/889307/ テレワーク支援が手厚い会社 vs 全部自腹会社の差がスゴすぎるhttps://news.livedoor.com/article/detail/19480387/ 【フリーランス・副業の実態調査】転職活動中ではない専業フリーランス、 副業ワーカーの4割以上が、副業を通して転職を検討すると回答https://prtimes.jp/main/html/rd/p/000000076.000042378.html
374 :白川前日銀総裁を痛烈批判 自民・世耕氏 :2023/03/05(日) 18:23:51.13 ID:l72aQz6n.net 自民党の世耕弘成参院幹事長は5日、NHKの討論番組に出演し、日銀前総裁の白川方明氏が黒田東彦総裁の「異次元緩和」を疑問視したことに対し、「白川総裁時代に金融緩和をかたくなに行わなかったことが、深刻なデフレに日本が陥った最大の原因だ」と痛烈に批判した。 その上で「まずご自身の時代をしっかり総括していただきたい」と語った。 白川氏は1日公表の国際通貨基金(IMF)季刊誌に「金融政策の枠組みを再考する機は熟した」と寄稿した。 世耕氏は番組で、次期日銀総裁候補の植田和男氏が国会の所信聴取で示した金融政策に関する見解を評価。「黒田総裁の下の姿勢をしっかり引き継いでくれる」と述べ、植田氏がアベノミクスを継承するとの見方を示した。 これに対し、立憲民主党の田名部匡代参院幹事長は同じ番組で、2%の物価上昇目標を明記した政府・日銀の共同声明について「見直すべきだ。アベノミクスは既に失敗している」と強調し、金融政策の抜本的な見直しを訴えた。ただ、植田氏の総裁起用人事案については「これから結論を出していく」と述べ、賛否を明らかにしなかった。
375 :nobodyさん :2023/09/30(土) 00:16:12.96 ID:???.net ホンマに、こんなとこに店あんのか?
89 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver.24052200
本文 スレッドタイトル 投稿者