2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

Namazu全文検索システム

1 :名無しさん@お腹いっぱい。:2001/06/14(木) 09:17 ID:???.net
全文検索システム Namazu
http://www.namazu.org/

日本語全文検索エンジンソフトウェアのリスト
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/other-system.html

前スレ http://tako.2ch.net/test/read.cgi?bbs=perl&key=981352718

2 :名無しさん@お腹いっぱい:2001/06/14(木) 15:26 ID:???.net
いか焼きそば

3 :名無しさん@お腹いっぱい。:2001/06/15(金) 01:24 ID:???.net
namazuはカスタマイズがやりにくいのが嫌いだ。
作り直しきぼん。

4 :名無しさん@お腹いっぱい。:2001/07/05(木) 09:41 ID:???.net
http://64.124.197.202/main.htm

namazuってやっぱり負荷かかるのかな。

5 :名無しさん@ディストリいっぱい:2001/07/05(木) 10:22 ID:wD33sdDI.net
>>4
index作る時にはCPU使用率100%になります。
項目がいくつもあるとかなりツライです。

↓うちのNamazu
http://2ch.dyn.to/

6 :名無しさん@お腹いっぱい。:2001/07/05(木) 17:05 ID:???.net
100%?(w
すご・・・

7 :でり:2001/07/06(金) 02:36 ID:???.net
>>5 ん、それは負荷テストに参加してくれというお誘いかな (w

8 :名無しさん@お腹いっぱい。:2001/07/09(月) 00:57 ID:muVIdrhs.net
ここ見てユーザーディレクトリにインストしちゃっていいもんでしょうか?

http://www.amays.com/~mizusawa/namazu_kaisetu/noSUinstall.html

当方レンタルサーバー 専用サーバー持つ金ありません。
C言語は使えます。負荷のかからないように、自分のマシンでindex作ればいいかな。
っていうかレンタルサーバー会社に聞かずにやっちゃって、かまわんかしら(汗

9 :名無しさん@お腹いっぱい。:2001/07/25(水) 04:10 ID:OjwNZy2I.net
インデックス構築中に検索かけられるとCGI TimeOut出ちゃうことが多々あります・・・

http://www1.odn.ne.jp/mimizun/

10 :名無しさん@お腹いっぱい。:2001/07/25(水) 18:41 ID:smjKvwXM.net
nice で優先度落とせばいいじゃん。

11 :名無しさん@お腹いっぱい。:2001/08/01(水) 18:06 ID:ix6uIOfU.net
windowsだし。

12 :ナナ萌え(゚д゚)ウマー:2001/08/02(木) 00:34 ID:???.net
WIN2Kに入ってるインデックスサービスってどーなん?

13 :名無しさん@お腹いっぱい。:2001/08/04(土) 01:50 ID:aNwZ.JX..net
>>12
穴。まさぐられると逝ってしまうぞ。

14 :名無しさん@お腹いっぱい。:2001/08/10(金) 14:53 ID:A94SLV6Y.net
2.0.6 release age

15 :初心者:2001/08/11(土) 11:52 ID:???.net
NAMAZUのインデックスにはたくさんファイルがありますけど、
いらないファイル(テンプレート等)も多いと思います。
結局必ず必要なファイルってどれなんですか?

16 :名無しさん@お腹いっぱい。:2001/08/12(日) 00:26 ID:???.net
>>15
んー俺もそう言えばわからん、
もともと、俺にとって、このNamazu初めの頃難しすぎた。

その前に、うなぎ食いたいんだよね。腹減ってきた・・・

17 :NAMANAMA:2001/08/12(日) 01:02 ID:TrSLsWVY.net
namazu2.0.5なんだけど、共有サーバにインストールしたんですよ。
でも、さすがにインデックスの作成は共有サーバでやるのも申し訳ないので、ローカルで作ってあげてます。
そういう場合って、namazu.cgi, .namazurc, Template, Index以外は全部テデリっても問題ないですかね?

それと、やっぱ、インデックスをcrontabで定期的に共有サーバで作ったら迷惑でしょうか?
マジレスお願いします。

18 :むぎ茶      :2001/08/12(日) 01:08 ID:???.net


ばれなければ問題無い。


┐(´ー`)┌


┏━━━━━━━━━┓
┃('Д')y ─┛~~ ┃
┃むぎ茶      ┃
┃mugicha@360.cc  ┃
┗━━━━━━━━━┛

19 :名無しさん@お腹いっぱい。:2001/08/12(日) 01:24 ID:???.net
>>17
負荷はかからないけど、ローカルは、めんどくせぇ(涙

20 :名無しさん@お腹いっぱい。:2001/08/12(日) 17:40 ID:KkZ3OuWw.net
Namazu.pm使ってperlでCGIを作りたいんですが…
Namazu.pmってあまり人気がないんですか?
参考スクリプト(書籍・サイト)がなかなか見つからなくって
何かありませんか?

21 :名無しさん@お腹いっぱい。:2001/08/15(水) 21:03 ID:???.net
>>20
ない、と思う。
まあしかし機能はシンプルなことこのうえないので、
利用にあたってそんなに難しいこともないと思うけど。

Ruby 用のモジュール rbnamazu.rb の方機能は多そうだ。

22 :名無しさん@お腹いっぱい。:01/08/28 05:33 ID:aw.N/Mco.net
どう?namazu使ってつくったやつ。
とりあえず2ちゃんねる全板検索可能です。

http://mimizun.mine.nu/

23 :名無しさん@お腹いっぱい。:01/08/28 21:59 ID:1JnfOa0A.net
お奨め本おしえte

24 :名無しさん@お腹いっぱい。:01/08/29 00:17 ID:TsF5AU7k.net
>>22
これ、すげぇじゃん。

25 :名無しさん@お腹いっぱい。:01/08/29 02:52 ID:1UTTw6kk.net
>>24
どこが?

26 :名無しさん@お腹いっぱい。:01/08/30 12:01 ID:8CpRLBMo.net
namazaってCGIやSSIで出力する内容も検索するんですか?

27 :名無しさん@お腹いっぱい。:01/08/30 12:11 ID:3TFNK/cI.net
namazaは知りませんが
Namazuで検索できるのは「ファイル」だけのようです。

28 :名無しさん@お腹いっぱい。:01/08/30 23:03 ID:YzLgVA/..net
はやくpostgresqlのテーブルの中身を検索できるようになっておくれ。

29 :名無しさん@お腹いっぱい。:01/09/10 22:31 ID:2EURowzo.net
>>22
みずずん大丈夫?

30 :名無しさん@お腹いっぱい。:01/09/10 22:32 ID:???.net
みみずんか(藁

31 :名無しさん@お腹いっぱい。:01/09/11 12:11 ID:liJMw8bE.net
XMLの検索ってどうなの?

32 :名無しさん@お腹いっぱい。:01/09/17 18:14 ID:???.net
>>31
filter 書いてくれ。

33 :名無しさん@お腹いっぱい。:01/09/17 18:18 ID:dMB6uEtM.net
>>28
Namazuシステムの構築と活用, ソフトバンク
やっぱこれじゃない?

34 :名無しさん@お腹いっぱい。:01/09/17 18:21 ID:FURvtMLg.net
>>28 PostgreSQLスレッドで誰かやってなかったっけ?

35 :名無しさん@お腹いっぱい。:01/09/17 23:18 ID:???.net
>>34
よく知らないけど、pgnmz はPostgreSQLにNamazuのインデックスを
入れておいて、DBにクエリー投げて検索結果を出すという感じっぽいので、
テーブル内容検索とはちがうっぽい。
ttp://search.namazu.org/ml/namazu-users-ja/msg01550.html

36 :名無しさん@お腹いっぱい。:01/09/20 17:20 ID:TUOJrHAw.net
PHPファイルを検索できるようにするにはどうすれば良いんですか?
ソースがまんま出ちゃうんですけど。

37 :名無しさん@お腹いっぱい。:01/09/26 22:51 ID:9178Yr9s.net
>>36
PHP の出力を検索させたいのなら出力した結果をファイルにして
それにインデックスをかけるとかしないと無理。

38 :36:01/09/27 00:11 ID:IzjiFxn2.net
>>37
「出力した結果をファイルにする」ってのは、phpでですか?
なんかそこら辺のこと詳しく書いてあるサイトが無いんで…。
Namazuシステムの構築本に書いてないかなー

39 :名無しさん@お腹いっぱい。:01/09/27 01:15 ID:???.net
>>38
php のことよく知らないけど
php scriptname.php ってやったら出力されないかな?

ところで俺も質問なんだけど、namazu.cgi って検索後は
ファイルへのリンクを http://hostname/hogehogeで出力するけど、
こいつを file://hogehoge にする方法って無い?
windows でローカルファイルの検索に使いたいんだけど WEB で
探しても見つからなかった。

40 :名無しさん@お腹いっぱい。:01/09/27 17:20 ID:IzjiFxn2.net
>>39
php scriptname.phpだとコマンドすら無いって言われてしまう。

指定先は.namazurcってファイルで設定できる↓参照
http://village.infoweb.ne.jp/~fwnk1502/data/howto2.htm#namazurc

41 :名無しさん@お腹いっぱい。:01/09/27 22:04 ID:clsPKe1Y.net
コマンド版のPHPがないとダメじゃないかねえ。

>>39 はインデックス作成時に
mknmz --replace='s#^#file:///'
とかでもいけそうだけどどうよ。

42 :39:01/10/01 05:28 ID:UjeefWpE.net
2chNo1(と思える)過疎板にて反応があって感動。

>>40
.namazurc で
Replace http://localhost/ file://
と指定してみてたんだけど、どうやら無効の模様。
この部分(http://hostname)は固定で出力してるのかな?

>>41
やってみたけどだめっぽい。
でも他にそれらしいオプションも見つからないね・・・

こういう変な事やる時は cgi 改造しか無いのか、とほほ。
pnamazu か rbnamazu に挑戦してみよう。

ところで >>40 はうまくいったかな?
アパッチのモジュール lib_php3.so (だっけ?) しか
インストールされてない時は >>41 の 言う通りコマンド
ラインで使えるようにしよう。手動で最初からやってみ
たこと無いので詳しい説明できなくてごめん。

43 :40:01/10/04 19:40 ID:4sun3RUk.net
返事遅れてスマソ。

>> 39
うちは
Replace /C\|/docume~1/admini~1/mydocu~1/mywebs~1/ http://ark/
みたいな感じになってる。ちなみにこの行と
Lang ja_JP.SJISと書かれた行以外は全てコメントアウト

php検索はコマンドラインで使えるように設定してみます。
というかコマンドラインで使えるようにする方法すら知らないんだけど。
どこか書いてるとこ知りません? 本でも良いんですけど。

44 :アナログから光までオッケー:01/10/05 02:03 ID:7kq.xdqk.net
このサイトはみなさんのインターネット環境の
スピードを計ってくれます。また、遅いと思う
人は設定を少し変えることによって無料で
スピードを早くすることができます。
お金を出す前に一度試してみては
いかがでしょうか。上がりの計測も可能です。

http://cym10262.omosiro.com/

45 :22:01/10/05 02:47 ID:UlE8Ntsc.net
http://www.max.hi-ho.ne.jp/~http/

46 :名無しさん@お腹いっぱい。:01/12/09 11:02 ID:eU0f+J4K.net
だめだ〜Out of Memory!で止まっちゃうよ〜。
一応FAQに書いてあることは試したつもりなんだが・・・。
どうも特定のファイルの時にそうなってるみたい。
なんか落ちやすい文字とか、そういうのあるんかな?

47 :名無しさん@お腹いっぱい。:01/12/10 22:24 ID:UuNX8sYB.net
設定の問題かどうか

48 :名無しさん@お腹いっぱい。:01/12/15 22:02 ID:???.net
ulimit がらみだと思うけど > Out of Memory
もしくは本当にメモリ(+仮想メモリ)が足りないか。

49 :名無しさん@お腹いっぱい。:02/01/04 06:04 ID:HxTTmUTv.net
use POSIX 'strftime';
print strftime "%Y%m%d\n", localtime;
こう書くと年月日が出るじゃないですか。
この日付けに7を足す事ってできます???

50 :名無しさん@お腹いっぱい。:02/01/04 06:04 ID:???.net
>49
マルチうざい
資ね!

51 :名無しさん@お腹いっぱい。:02/01/04 23:19 ID:???.net
>>49
逝って良し。

■解説■
 マルチは下げ進行で微妙に煽りつつシカトします
 上記例のように古典的な煽りは「逝って良し」
 他にアスキーアートを使ったものなど多彩ですが、
 サーバーの不可を考慮してかあまり好まれません。
 やはりシンプルに「氏ね」など短文なものがベストです。

52 :名無しさん@お腹いっぱい。:02/01/09 18:03 ID:???.net
あげ

53 :名無しさん@お腹いっぱい。:02/01/12 04:40 ID:???.net
age

54 :名無しさん@お腹いっぱい。:02/01/13 16:11 ID:???.net
もう、、下げといてやれよ。。

55 :名無しさん@お腹いっぱい。:02/01/13 19:32 ID:???.net
>>54
再利用というか、もっかい盛り上がることが出来ないスレなんですか?(笑)

56 :名無しさん@お腹いっぱい。:02/01/25 06:48 ID:YyTiWZ/9.net
半年で、50位か。1000までいったら感動するな。あげ

57 :名無しさん@お腹いっぱい。:02/02/18 08:00 ID:TWCf5+1d.net
age

58 :1001 Over 1000 Thread:02/02/18 10:21 ID:Qb17d1xd.net
このスレッドは1000を超えました。
もう書けないので、新しいスレッドを立ててくださいです。。。

59 :名無しさん@お腹いっぱい。:02/02/19 07:42 ID:DggBq+7H.net
age

60 :名無しさん@お腹いっぱい。:02/02/20 22:28 ID:???.net
関連スレ
全文検索エンジンNamazu @ Unix板
http://pc.2ch.net/test/read.cgi/unix/1009715036/l50

61 :nobodyさん:02/03/11 21:08 ID:Jt12j7IU.net
namazuの検索、なんか使いにくいんだけど。。
変に文節で区切らずに、googleみたいに普通に検索してくれたら
それでいいのに。。

62 :nobodyさん:02/03/11 23:50 ID:???.net
>>61
うん。

63 :nobodyさん:02/03/12 07:59 ID:qMnzd5b/.net
>>61
これのこと?

>日本語がでたらめにわかち書きされてしまう
>{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、
>でたらめにわかち書きされることがあります。
>これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。
>検索はあきらめましょう。

それとも、インデックス作るときの分かち書きをしないでほしい、ってこと?
それって実現できるのか?

64 :nobodyさん:02/03/18 17:35 ID:???.net
googleはユーザーにあまり意識させないだけで、分けて探してるよ

65 :nobodyさん:02/03/19 11:29 ID:ulLvfL7+.net
googleわけてるかな?
日本語は解析していないように見えるけど…。
英語はスペースでわけるだけだから楽だね。
それにしてもgoogleはスペルミスの修正判断も出してくれたりすごい。
つーか20億ページを0.1秒で検索できるのが単純にすごいと思うのだが。
ローカルでほしい、、

66 :nobodyさん:02/03/19 12:54 ID:TPtrOTqR.net
>>65
googleも分かち書きしてるらしい、という実験結果がある。

検索エンジンのしくみ教えます
http://www.google.com/search?hl=ja&ie=Shift_JIS&oe=Shift_JIS&q=cache%3AALmw0POy8V4C%3Awww.mars.sphere.ne.jp%2Fengine%2Fchap_g1.htm+site%3Awww.mars.sphere.ne.jphl%3Dja+Google&lr=lang_ja

なんか 403 forbidden になってるんでgoogleのキャッシュで見てね。

67 :nobodyさん:02/03/19 14:31 ID:???.net
>>66 さん、ありがとうございます。
ほんとだ。分かち書きしてる、、
うむ、googleはちゃんと各言語ごとにチューンしてるんですね。

68 :nobodyさん:02/03/19 15:32 ID:TPtrOTqR.net
逆に言えば、分かち書きエンジンの精度さえ向上させれば、
google並みのことはできるってことだよね
(もちろん、PageRank とかは抜きにして)。

いつも kakasi だけど、Chasen を使ってみようかなあ・・・。

69 :nobodyさん:02/03/19 15:52 ID:???.net
個人で使うような件数の多寡が知れているようなシステムだったら、純粋に全件マッチ検索の方が便利だよね。

70 :nobodyさん:02/03/19 20:25 ID:???.net
>>68
googleの肝は結果の表示順序。(pagerankもそれを支える情報の一つ)
なので、namazuに少し手を入れたぐらいではgoogle並にはならないよ。
ヒット数が少ない場合、関係ないけど。

71 :nobodyさん:02/03/19 20:38 ID:???.net
>>70
その点は激しく同意。

ただ、分かち書きの精度を上げることで、
>>61 のやりたいことは実現できるんじゃないかな、って思った。

72 :nobodyさん:02/04/24 13:48 ID:???.net
(´_ゝ`)フーン

73 :ato:02/05/09 14:31 ID:8gc3nIf4.net
Namazu使ったPDFの全文検索でページしていとかできますか?

74 :nobodyさん:02/05/10 00:55 ID:???.net
Namazu使ったJPGの全文検索でページしていとかできますか?

75 :nobodyさん:02/05/10 02:55 ID:???.net
>>70
いまさらだが、NamazuへのPageRankの実装は、この論文が有名。
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html

76 :nobodyさん:02/05/10 07:02 ID:???.net
>>75
まだ、このスレが生きていたとはね
興味深い文章サンクス。
改めて深入りできない、しちゃいけない分野だと再確認したよ

77 :nobodyさん:02/05/10 20:41 ID:???.net
77ゲットオォォォォ!!
 ̄ ̄ ̄ ̄ ̄∨ ̄ ̄ ̄       (´´
     ∧∧   )      (´⌒(´
  ⊂(゚Д゚⊂⌒`つ≡≡≡(´⌒;;;≡≡≡
        ̄ ̄  (´⌒(´⌒;;
      ズザーーーーーッ


78 :nobodyさん:02/05/24 03:19 ID:???.net
(・∀・)イイ!

79 :nobodyさん:02/05/27 19:51 ID:LrpMVRit.net
類似スレッド

WWW検索エンジンサイト
http://pc.2ch.net/test/read.cgi/esite/973436559/l50

80 :nobodyさん:02/06/06 04:44 ID:jW1FwXu2.net
ひさしぶり!

81 :nobodyさん:02/06/09 00:21 ID:MvwsaEnI.net
コレ、namazuの対抗馬になれるか?
http://freshmeat.net/projects/snatcher/

82 :山拓変態問題:02/06/20 09:30 ID:???.net
mp3用のフィルタって誰か書いてないかしら?

83 :nobodyさん:02/06/20 09:39 ID:updula6F.net
Namazuでmp3用のフィルタ???
わからん、俺がアフォなだけか?

84 :nobodyさん:02/06/20 12:41 ID:0pQ6ektu.net
>>82
ID3タグでも検索するのか?
そういうのは ふつー DB 使うだろ。

85 :山拓変態問題:02/06/20 15:09 ID:???.net
>>83-84
自分のホームヂレクトリをクロンで毎晩なめてるんだけど、
どうせなら、ID3も見てくれないかなと。
変かなぁ。


86 :82=85:02/06/20 15:34 ID:???.net
って、WEBプログラミングとは、違いますな。
スレ違いスマソ。


87 :nobodyさん:02/06/25 01:01 ID:cgKxt6dS.net
>>86
なるほど、mp3 の中に埋め込まれたテキストも「文書」として扱い、
検索対象としたい、ってわけね。全然変じゃない。むしろ面白い。
やってることは google のイメージ検索みたいな感じかな。

perl でサクッと書けそうな雰囲気。
ぜひトライしてみて。

あと、Web プログラミングとは関係ないけど、
Namazu に関係あればいいと思うよ。

88 :nobodyさん:02/06/25 02:46 ID:???.net
いや、それをWebから使えるようにすりゃWebプログラミングと
むちゃくちゃ関係あるじゃん。

> やってることは google のイメージ検索みたいな感じかな。

イメージ検索は外部から関連性を持ってくるのでちと違うような。
内部のID3だけだったらPDF検索くらいに対応するだろう。
ぜんぜんNamazuじゃなくても良さそうだけど、他と串刺し検索するなら
やっぱり便利かも。

89 :nobodyさん:02/08/12 22:58 ID:???.net
うなぎ食べたいね。

90 :nobodyさん:02/09/02 23:28 ID:???.net
ナマズマズー

91 :nobodyさん:02/09/20 08:19 ID:???.net
ウマー

92 :nobody:02/09/21 15:05 ID:???.net

検索結果で表示されるファイルの先頭部分のサイズを変更できますか?
やりかたを教えて下さい。

93 :nobodyさん:02/09/25 08:37 ID:3VOnIdJA.net
wget
でURLテキスト-iで、ディレクトリ作成-x
しながらページ拾ってくると、
稀にディレクトリ作成(www.aaa.xxx)されなくて
関係ないディレクトリ(www.bbb.xxx)にページを
格納してしまいます。

このままindex作るとURLリンクが関係ないところに。
どうしてだろう。困った。

94 :nobodyさん:02/09/27 20:30 ID:7S/gcFrV.net
Office XPファイルは、インデキシングできないのかなぁ。

95 :nobodyさん:02/09/28 02:50 ID:gf1ROtiY.net
    @ノハ@
 ピュー( ‘ д‘)
  =〔~∪ ̄ ̄〕
  =◎−−◎


96 :名無しさん@お腹いっぱい。:02/10/07 17:04 ID:ucR8g7pl.net
   @ハヽ@
  (' д ‘)ピュー
   〔~∪ ̄ ̄〕=
   ◎−−◎=

づかれたゾイ

97 :名無しさん@お腹いっぱい。:02/10/07 17:05 ID:ucR8g7pl.net
↑車輪がずれたゾイ

98 :nobodyさん:02/11/02 15:20 ID:Jwe6TBuD.net
ウマー

99 :Windows における namazu w/chasen:02/11/03 10:47 ID:rQsphwgx.net
Chasen を使ったインデックス作成が出来ません
http://www.namazu.org/ml/namazu-win32-users-ja/msg00671.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00672.html
http://www.namazu.org/ml/namazu-win32-users-ja/msg00692.html

を見ると、2001/05 時点で chasen を使ったインデックス作成は
cygwin 環境で行うことができるようですが、
現在も chasen を使おうとすると cygwin 上で行うのが妥当でしょうか?

100 :Windows における namazu w/chasen:02/11/03 11:17 ID:???.net
>>99
Chasen 2.0.2 は cygwin 上で問題なくコンパイルできました。

101 :Windows における namazu w/chasen:02/11/03 11:33 ID:???.net
Namazu 2.0.12 は cygwin 上で問題なくコンパイルできました。
cygwin のデフォルトの perl 関連のパッケージでは File::MMagic はインストールされないので、
CPAN http://search.cpan.org/dist/File-MMagic/ からダウンロードしてきて
あらかじめ (configure の前に) インストールしておく必要があります。

102 :Windows における namazu w/chasen:02/11/03 14:10 ID:rQsphwgx.net
namazu + chasen は cygwin で 問題なく動きました。
cygwin のコアDLLのバージョンは 1.3.14-1 です。

103 :nobodyさん:02/11/03 23:09 ID:sdt4YScv.net
>>99
全部cygwinでやる方法以外無いのでは?
そもそもkakasiを使う事が推奨されていて。
茶筅は結構イレギュラーな方法なわけだし。
(運用上結構問題がある)




104 :nobodyさん:02/12/03 00:32 ID:???.net
ウマー

105 :nobodyさん:02/12/26 00:21 ID:DUegdvZH.net
namazuを2chのdat形式に対応させようとしている人っていますか?
形式自体はレス1つが1行になっているだけなんだけど、<a name="hoge">をつけるのもなんか違う気がするし。
ファイル名と行数だけ教えてくればそれでよいんですが。
Namazuでやっているようなこと、ChaSenで分かち書きしてインデックス作ってcgiで検索っていうのも作りかけたけど、
車輪の再発明になりそうで中断してる。

106 :nobodyさん:02/12/26 00:41 ID:M1+zinp+.net
>>105
dat からそのままインデックスを作りたいってこと?
mknmz 用のフィルタを書けばいいだけだよね。
perl だし結構簡単そうだね。

107 :nobodyさん:02/12/26 01:19 ID:DUegdvZH.net
>>106
そのとおりっす。
各行の先頭に<a name="スレ番号"></a>入れて、理由は不明ですが、先頭行に適当に<html>とか入れてあげて、
mknmz --html-split -a hogohoge.dat
でインデックスは作れたし、検索もできるのは分かるのですが、
mknmzのソースのprocess_file辺りを見ると、コメントに、FIXME: Very complicated.とあるくらいなんで、めんどいなと。
html向けには分割して処理してるみたいですし。
誰か同じようなこと考えていないかなと。

108 :nobodyさん:02/12/26 01:48 ID:M1+zinp+.net
>>107
read.cgi が出力する html をインデックスするよりも、
dat から直にインデックスする方がきっと速い。
いちいち dat から html 作らないから、不要なファイルを作らなくてもよい。
html として出力するのは 2ch ビューアとか、read.cgi に一任できる。
利点はこのあたりかな。みみずんとか喜びそうだよね。

結局、mknmz の仕様に則ったフィルタを作ればいい。
html.pl とか参考にして作ってみたら?
http://cvs.namazu.org/namazu/filter/html.pl?rev=1.34&content-type=text/vnd.viewcvs-markup

もし実現できたら、cvs にある scheme/http.pl と組み合わせて、
2ch.net の dat を直接インデックスできるかな。
あ、今 2ch.net は dat 直読みできないんだっけ? だめか。

109 :nobodyさん:02/12/26 02:05 ID:DUegdvZH.net
>>108
フィルタ自体はHTMLのでも十分なんですよ。
--html-splitなしでは、mknmzってファイル単位でしかインデックス作らないじゃないですか。
datってスレ毎で、全レスが入っているから、スレごとにしか検索できないことになってマズーなのです。
p2 ( http://pc.2ch.net/test/read.cgi/mac/1034199997/ )のdatを2次利用したいなと思っていろいろ試してます。
>>107 に書いたように、mknmzのprocess_fileあたりの--html-split処理部を書き換えてみてます。

110 :nobodyさん:03/01/02 18:30 ID:cP1MLYPA.net
>>109
--html-split的なファイル分割を実現している人がいます。
本家には全く取り込まれていませんが…

Emacsのinfoファイルの分割(X-ml-name: namazu-devel-ja X-mail-count: 02059 )
http://www.namazu.org/ml/namazu-devel-ja/msg02063.html

PDFファイルをページごとに分割(X-ml-name: namazu-devel-ja X-mail-count: 01951)
http://www.namazu.org/ml/namazu-devel-ja/msg01950.html

つーかどちらも実装したのは僕ですが…

実現は単純だと思います。
行ごとにsplitするだけでとりあえずは実装できると思います。
見やすいようにフィールド情報を与えるためにはちょっと工夫がいるかもしれません。
ただフィールド情報が無くても十分有用だと思います。
そのページだけじゃわかりづらいと思うのでわからなかったら質問してください。

navi2chやら他の2ちゃんねるブラウザと連携すれば便利かもしれません。
ある特定のスレだけを検索対象にしてwebに公開しても便利かもしれません。


111 :nobodyさん:03/01/03 09:06 ID:???.net
管理の都合上、
すべてのページについて、php4とpostgresを使っていて、
URLは http://domain.com/foo/?category=bar の形式で作ってるんですが
(fooとbarはいろいろ変わる&postgresでページの階層構造を管理してる)
これにNamazuを導入するには、どうすればいいんでしょうか・・・?



112 :nobodyさん:03/01/03 09:29 ID:v/h8n2uJ.net
 

113 :111:03/01/03 18:29 ID:lPX3I1sa.net
あーれー、レスがない。

114 :nobodyさん:03/01/03 18:42 ID:???.net
>>113
そういうこと書くと逆効果。大体お正月で人いないし。
そうだなあ、来週の金曜までにレスが無かったら、私がレスするよ。

115 :nobodyさん:03/01/03 18:49 ID:???.net
>>113
この板でたかだか9時間くらいで何をいってるんだか。
再来週の木曜日までにレスがなかったら俺がレスするよ。

116 :111:03/01/04 00:23 ID:U6dtWDEb.net
とりあえず、それまでに、自学でなんとかできるかできないかなでの段階に、
・・・いきたいな

117 :111:03/01/04 19:17 ID:BatkqzbV.net
検索にひっかからない。。。

「php namazu インデクサ」とじゃ
「php namazu シェルスクリプト」とかで検索してるんだけど、
いまいち該当しない。

検索のヒント、ください。

118 :111:03/01/11 17:11 ID:CeP+V+mb.net
ショボーン

119 :nobodyさん:03/01/11 18:22 ID:8y79ZXZ4.net
namazuかぁ。
ひらがなとかカタカナのもうめちゃくちゃな弱ささえ克服できればなぁ。
kakasiにひらがな単語の辞書登録さえあれば…。

もともと、そーゆープログラムではないから
AQに採用されることないけど。

120 :山崎渉:03/01/15 13:33 ID:???.net
(^^)

121 :nobodyさん:03/01/17 16:56 ID:TsHzDgv8.net
>>119
茶筅にしる!

122 :nobodyさん:03/01/18 02:26 ID:???.net
Googleみたいにヒットした単語の周囲の文章をサマリ表示させてほしい。
サマリは直接生成。

123 :nobodyさん:03/01/18 07:01 ID:0IdKnMy1.net
ところで、ウチのプロバイダはCGI使えないんだけど、全文検索(Namazuじゃなくても可)できる方法ないですかね。

124 :nobodyさん:03/01/18 15:04 ID:???.net
>>123
あらかじめ検索用のインデックスを作っておいて、javascriptで、〜〜〜〜

125 :124:03/01/18 15:07 ID:???.net
よく考えたら、自分の所でCGI使えなくても、
CGIを使えるサーバーを借りたら、解決だった。

126 :nobodyさん:03/01/18 16:10 ID:???.net
>>122
pnamazuつかえ


127 :nobodyさん:03/01/18 22:45 ID:KC3+f7J6.net
>>122
自分的にもそれは必須の機能だと思うんだけどなぁ。
頭の部分だけ静的に切り出したサマリーでずらずら検索で引っ掛かってきてもあんまサマリーの意味ない。
メーリングリストみたいにタイトルが内容の要約になってる、とかならいいんだけど。

128 :nobodyさん:03/01/21 15:04 ID:2m91wCEm.net
、、、すんません 教えて下さい。
Namazu 2.0.12 for Win32をWin98で使用しています。
mknmzを実行すると、下記のエラーが出てしまいます、、、

Can't locate File/MMagic.pm in @INC (@INC contains: . C:/Perl/lib C:/Perl/site/
lib .) at C:\USR\LOCAL\NAMAZU\BIN/mknmz line 34.
BEGIN failed--compilation aborted at C:namazu\bin/mknmz line 34.

お分かりになる方、いらっしゃっいましたら
ご教授ください。お願いします!

129 :nobodyさん:03/01/21 23:04 ID:???.net
MMagic が適切なパスにないか、インストールしていない。

130 :nobodyさん:03/01/22 00:18 ID:???.net
>129さん 早速のレス、ありがとうございます。
MMagicのインストールを行おうとすると、エラーがでるので確かにインストール
されていないようです。
namazuのパッケージに含まれてるppmは、500番台と600番台の2つなのですが
私のActivePerlのビルド番号を確認すると、804となっています、、、。
これが原因なんでしょうか?

131 :nobodyさん:03/01/22 22:49 ID:tlaGPNPQ.net
kabayaki使えYO!

132 :nobodyさん:03/01/22 22:55 ID:0SY2SNoc.net
「パソコンの仕組み」

http://pc1.moo.jp

パソコン・インターネットの仕組み、パソコン自作・サーバー構築法について、動画や静止画を豊富に取り入れて、初心者向けに基礎から分かりやすく解説しています。

ガンガン、アクセスしてください!!

133 :nobodyさん:03/01/22 23:06 ID:DuSjMjDY.net
小遣い稼ぎ
http://banana.fruitmail.net/cgi/introduce_jump2.cgi?1363289

134 :nobodyさん:03/01/23 09:19 ID:XTkiyicl.net
chasen使ってる人に質問です。
やっぱりkakasiより検索精度あがりますか?
とくにひらがな単語やカタカナ単語で。




135 :nobodyさん:03/01/24 13:46 ID:DnlSMTjH.net
 おまいら、namazuで検索するファイル数ってどのくらいですか?
1ディレクトリで1000ファイルオーバーとかって、インデックス
作るのに問題ないっぽい?
 なんか、毎日自動でインデックス作ってるんだけど、ちゃんと
インデックス作れてない(検索できない)場合が時々あるのよ。手動で
作ってやるとちゃんと動くところがまた憎らしい。

136 :nobodyさん:03/01/24 15:43 ID:9aIuMK5X.net
wgetの収集でたまにぜんぜん関係ないディレクトリに
index.htmが格納されて困るんだけどなんでだろう。
ブラウザ動かしながらやるとミスするのかなぁ。

win2k

137 :nobodyさん:03/01/25 15:38 ID:x6YUG/OM.net
pnamazuのほうがヒットしやすいのでしょうか?

perl版でインデックス作らないとダメなのでしょうか?

そのままのインデックスでpnamazu.cgiでとりこぼしが減るのでしょうか?

138 :nobodyさん:03/02/05 04:47 ID:vQpd3y9f.net
保守

139 :nobodyさん:03/02/05 06:56 ID:CehyN38W.net
http://homepage3.nifty.com/digikei/ten.html
いいね〜 これ♪


140 :nobodyさん:03/02/05 09:04 ID:LQrwCDVW.net
アダルトの宣伝↑

ナマズの派生で、カバヤキっていうのでたけど使ってる人いる?


141 :nobodyさん:03/02/05 09:11 ID:JiOCwoo3.net
http://www.agemasukudasai.com/bloom/

142 :nobodyさん:03/02/05 10:12 ID:???.net
初めて Namazu 使ってみたけど、SI には使いづらい作りだな…

143 :nobodyさん:03/02/05 11:27 ID:???.net
>>142
どこら辺が?
内容によっては、回避策や運用のテクニック教えてあげられるかも。

144 :nobodyさん:03/02/07 03:32 ID:/4XUF2iq.net
MS-Access + ASP の like による全文検索と Namaz でインデックス
作成した全文検索ってどのくらいパフォーマンスが変わってくるかなー

検索対象レコード:1000、検索対象フィールド:3
各フィールド60,000文字ぐらいで考えてるんだけど、
MS-Access + ASP じゃ無理あるかな・・・
2、3秒で検索結果がでてくればいいのですが・・・
インデックスの作成自体、最近気づいた愚か者ですが、
よろしくお願いいたします  m(_ _)m


145 :nobodyさん:03/02/07 06:28 ID:KeFGYCTZ.net
http://jsweb.muvc.net/index.html
?????????

146 :nobodyさん:03/03/07 18:19 ID:+bpjK8Vp.net
UNAGI

147 :nobodyさん:03/03/08 13:01 ID:???.net
Namazuが装備されてるレン鯖なら
http://www.akira.ne.jp/index.htm

148 :nobodyさん:03/03/08 16:11 ID:6pWNtujS.net
あるファイルを処理できるフィルターが複数あるとき、
どちらを使うかはどうやって決まるのでしょうか?


149 :山崎渉:03/03/13 17:05 ID:???.net
(^^)

150 :nobodyさん:03/03/13 20:02 ID:???.net
(・∀・)イイ!

151 :nobody:03/03/28 00:40 ID:???.net
(´-`).。oO(保守……。)

152 :山崎渉:03/04/17 12:25 ID:???.net
(^^)

153 :山崎渉:03/04/20 06:08 ID:???.net
   ∧_∧
  (  ^^ )< ぬるぽ(^^)

154 :nobodyさん:03/04/23 13:38 ID:???.net
うちのノートPC、2chのlog数百個程度mknmzしてると
CPU周り熱々になって九割方落ちる鬱

155 :nobodyさん:03/04/28 11:08 ID:???.net
レン鯖レン鯖

156 :nobodyさん:03/05/14 16:15 ID:???.net
(・∀・)

157 :nobodyさん:03/05/18 02:04 ID:inHKtSNs.net
Namazuを使ってます。
ただ、データの量が多くインデックス作成に失敗する事が多々あり、
現在は分割して、インデックスを作成。
ここに追加( --no-delete オプション)しています。
(更新は週に1回でも十分なので、本当は週に1回最初からインデックスを
作り直したいのですが、時間的にも労力的に厳しいです)

質問なのですが、上記の --no-delete オプションで一部のファイルをインデックスに
追加することと逆に、なんらかの方法で「指定したファイル」のインデックスからの
削除は可能でしょうか?


158 :nobodyさん:03/05/18 10:06 ID:OMFaVw9A.net
>>157
>データの量が多くインデックス作成に失敗する事が多々あり

うちではそんなこと無いなあ。まあ10万ファイル程度だけど。
データ量が多いってどのくらい?
インデックス作成失敗って、どんなメッセージが出てどんな状況になるの?

159 :nobodyさん:03/05/18 14:25 ID:???.net
>>158
共用サーバにてインデックスを作成、Namazuを利用しています。

おおよそ、1MB前後が1回あたりのインデックス作成の限度のようです。
メッセージは「Out of Memory!」です。


160 :nobodyさん:03/05/18 17:53 ID:???.net
ローカルのマシンでインデックスを作ってアップロードじゃだめなん?

161 :nobodyさん:03/05/19 02:54 ID:???.net
>>160
それも考えたのですが、インデックスには当然ローカルのファイルのパスが含まれてますよね?

現在はReplaceで、サーバのパス/virtual/ID/→http://〜の絶対パスに変更しています。
ローカル(Windowsマシン)C:\〜を絶対パスhttp://〜に変更させる事ができるのでしょうか?


162 :nobodyさん:03/05/19 08:52 ID:???.net
>>161
だって自分でやってるって書いてんじゃん。


163 :nobodyさん:03/05/19 11:12 ID:???.net
なんだ、結局サーバのメモリ使用量制限に引っかかってるだけじゃん。
Namazu と直接関係ないじゃん。

>>161
可能。パスを書き換えて、インデックスを再構築すればいい。rfnmz だっけ?
ml の過去ログで似たような事例を見た気がする。

164 :nobodyさん:03/05/19 12:36 ID:R1nWpNfc.net
NamazuってリレーショナルデータベースのIndex検索できますか?
Javaで書かれたLuceneってのはできますよ。

165 :動画直リン:03/05/19 13:08 ID:IEVyzYan.net
http://homepage.mac.com/hitomi18/

166 :nobodyさん:03/05/19 14:26 ID:???.net
>>162
>>163
ありがとうございます。

wget>インデックス作成>検索と3段階で相当な負荷が
サーバにかかっていたので、いつアカウントを止められるのか
心配していました。

wget>インデックス作成まで行えれば、
検索だけをサーバで行うので負荷も和らげられると思います。

167 :nobodyさん:03/05/19 15:01 ID:hryn2RRe.net
(;´Д`)ハァハァ
http://homepage3.nifty.com/coco-nut/

168 :bloom:03/05/19 15:08 ID:IEVyzYan.net
http://homepage.mac.com/ayaya16/

169 :nobodyさん:03/05/21 10:19 ID:???.net
ローカルのWindowsのNamazuと、共用サーバのLinuxのNamazuのインデックスは
互換性があるのでしょうか?


170 :nobodyさん:03/05/21 14:38 ID:zDb/UTki.net
age

171 :bloom:03/05/21 15:08 ID:JZ9K0e/X.net
http://homepage.mac.com/ayaya16/

172 :nobodyさん:03/05/22 00:10 ID:???.net
>>169
あるよ。

173 :nobodyさん:03/05/22 01:10 ID:???.net
>>172
ありがとうございます。

Liunxのインストールからはじめるのは辛いですし、
cgiでインデックスを作ろうとするとすぐに落ちるので
助かりました

174 :山崎渉:03/05/22 01:58 ID:???.net
━―━―━―━―━―━―━―━―━[JR山崎駅(^^)]━―━―━―━―━―━―━―━―━―

175 :nobodyさん:03/05/23 00:35 ID:???.net
(・∀・)

176 :山崎渉:03/05/28 17:21 ID:???.net
     ∧_∧
ピュ.ー (  ^^ ) <これからも僕を応援して下さいね(^^)。
  =〔~∪ ̄ ̄〕
  = ◎――◎                      山崎渉

177 :nobodyさん:03/05/30 16:43 ID:???.net
(・∀・)

178 :nobodyさん:03/06/18 16:39 ID:DT1VWY3V.net
そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?

179 :nobodyさん:03/06/18 22:37 ID:yFwDTAK+.net
>そろそろwindowsローカルのPHPマヌアルを検索できない不具合は解決してますか?

PHPマヌアルにかぎらずUTF8で書いてあるページは文字化けするツー事
nkfを利用しているからじゃないかな

180 :nobodyさん:03/06/19 00:34 ID:r/KT2iM+.net
nkf使ってないよ、lvでutf8対応している

181 :nobodyさん:03/06/25 14:23 ID:77oj5Ix9.net
Namazuってファイルの検索に使うんですか?
全文検索できないの?
できるんだったら、指定したキーワードを含むファイルだけから全文検索するなんて使い方も可能?

また、インストールしたLinuxとかのディスクに置いてあるファイルでないと検索できないのかな?
Windowsマシン上にあるファイルもさがせたりしないんでしょーか。

いろいろ関連サイト見てみたけどそういったことは書いてなかったYo!って探し方悪いんでしょうか



182 :nobodyさん:03/06/25 15:10 ID:vaUG6cj5.net
☆覗いてみてください☆(閲覧無料)
http://endou.kir.jp/yuminet/link.html

183 :_:03/06/25 15:12 ID:???.net
http://homepage.mac.com/hiroyuki44/

184 :ミルフィーユ:03/06/25 15:24 ID:???.net
カスケードスタイルシートって、
おいしそうですねぇ。

185 :nobodyさん:03/06/25 19:36 ID:???.net
>>181

no
no
no
no
no

調べ方悪すぎ。namazu.orgにある文章読むだけで全て分かるのに。

186 :181:03/06/27 00:27 ID:6z/IvjGb.net
>>185
noってそれぞれの私の質問に対する回答ですか?
いずれにしてもサンクス子 http://www.namazu.org/ いってきます。。m(。_。)m

187 :???:03/06/27 19:27 ID:1V/886pX.net
インデックスの作成 OK → Webサーバーへのアップ OK
→キーワード入力 OK →検索している 検索結果は出るのですが
全く関係のないページばかりリストアップ。そのページソースを検索キーワード
で探してもありません。

インデックスもエラーなくできて、アップも問題なくでき、検索もできるのですが
その結果が全くあさって・・・どこに問題がありそうでしょうか???。ご意見を
お願いします。

188 :nobodyさん:03/06/28 01:23 ID:???.net
>>187
Namazuってそんなもんだよ。
といいつつ、おれもインスコしてますが、自分では一切使わない。w


189 :187:03/06/30 07:16 ID:???.net
>>188
んっ〜それにしても結果が全く関係なさ過ぎるんですよ。
インデックスがまともに出来ていないような現象です。
ただ、作業的には問題なく進んでるんですよ・・・トホホ  。・゚(/д\)゚・。

190 : ◆MiMIZUNCjA :03/07/07 03:25 ID:sv7ydGsI.net
なんどもインデックスの構築をしているといつのまにかめちゃくちゃな回答をされるときがあって
そういう場合は最初から作り直しますがなんなんでしょうね。

191 : :03/07/07 03:54 ID:???.net
>186
たぶん回答じゃなくて、ガイジンさんなんだよ。
...no. no! no!! no!!! nohhh!!!!!! nanimochigaudesholtu!!!
って感じだと思う。

192 :山崎 渉:03/08/15 22:47 ID:???.net
    (⌒V⌒)
   │ ^ ^ │<これからも僕を応援して下さいね(^^)。
  ⊂|    |つ
   (_)(_)                      山崎パン

193 :nobodyさん:03/10/02 14:51 ID:???.net
no

194 :nobodyさん:03/10/06 00:26 ID:MvGVNeyO.net
なんだか自分は複数indexについてよくわかっていません。
複数indexを作る場合、
namazu.cgiと.namazurcのあるディレクトリの下に新しいディレクトリを作って分けて、.namazurcで制御すればいいんでしょうか?
今はindexファイルをnamazu.cgiと.namazurcのあるファイルと同じ階層に全部詰め込んでいます。
これだと、二つ以上のindexは作れないみたいです。

195 :nobodyさん:03/10/06 00:33 ID:???.net
複数インデックスは、 インデックスのあるディレクトリ内のサブディレクトリ名が
そのままインデクス名になる。使う場合は、.namzurcではなくて
NMZ.head.jaで idxname="foo" とか指定してやればいい。

196 :nobodyさん:03/10/06 06:50 ID:fxmWtj2Y.net
>>195
わかりやすいレスありがとうございます。
解決しました。

197 :nobodyさん:03/11/13 08:37 ID:Tw9dU9HY.net
相談なんですけど、

「ホスティング依頼している鯖に namazu を入れて、メールの全文検索ができ
ないもんかな?」

という相談をうけますた。

う〜ん…………

おいらの使ったのは、RedHatだったんで、namazuはRPMでなんも考えずに
入れて、インデックス作って使ってたことはあるけど、ホス依頼してる鯖だと
root 権限なんか貰えないだろーしなぁ……

なんかいい方法ってないでしょか?

198 :nobodyさん:03/11/14 09:37 ID:???.net
pnamazu

199 :197:03/11/14 14:31 ID:bYphtnKK.net
>>198

ありがとう!提案してみるよ

って、これ、インデックス作成はローカルの環境でするのかぁ
ま、いいや。相手がなんていうか、言うだけ言ってみよう

ヒントくれてサンクス!

200 :nobodyさん:03/12/20 12:12 ID:BT5vMVU9.net
特定のディレクトリのみ除外する方法は何かありますか?

201 :nobodyさん:03/12/20 14:36 ID:???.net
>>200
特定のファイル(拡張子だけだったかも)を除外する
という設定項目があった様な記憶があるんで、
もしかしたら、それの応用でディレクトリごと無視するとかできるかも。

#具体的にどんな設定をするかは忘れた
#多分namazuの本家サイト見たらあったよ

202 :nobodyさん:04/01/02 23:12 ID:???.net
自分のページは全て、「http://www.example/com/?cat=★」★はページごとに違う
という形式なのですが、
こういった動的なページに対してNamazuを使うというか、インデックスを作成するには、
どうすればいいのでしょうか?

203 :202:04/01/02 23:13 ID:???.net
もとい、
誤:「http://www.example/com/?cat=★」
正:「http://www.example.com/?cat=★」

204 :202:04/01/04 01:18 ID:LkXOe+SC.net
あ、すごいタイムラグあいてますね。。。age

205 :z33:04/01/04 10:35 ID:???.net
>>202
replaceでがんばってどうにかできないかな?

例えば
/home/apache/documentroot/test/1.txt

http://www.example.com/?cat=/test/1.txt
って変換だったら
Replace "/home/apache/documentroot" "http://www.example.com/?cat="
とか

こういうこと?

206 :202:04/01/05 22:28 ID:???.net
>>205
ありがとうございます。
全部、/?cat=★は「★.inc」としてファイルをおいてあるので、それでなんとかいきそうです。

207 :nobodyさん:04/01/19 19:55 ID:daYuprPN.net
教えてもらいたいことがあるんですが
nmz.field.****
の****を増やしたいのですが、どうしたら良いでしょうか?

具体的にはmknmz時にuriを見て
wwwroot/aaa/a.html
wwwroot/bbb/b.html
nmz.field.locate ってファイルを作ると
その中に
aaa
bbb
って出力されてほしい
で検索結果でyahooのカテゴリのように
<a href="a.html">aのタイトル</a>
カテゴリ TOP>>aaa(${locate}の値)とかやりたい
まぁ検索結果の中でuri見て変換したら良いんだけど、
もうちっとスマートに処理させたいなと・・・

208 :z33:04/01/20 22:20 ID:???.net
>>207
ちょっとググッて探してみたら、こんなの見つけたけど
http://www.namazu.org/ml/namazu-users-ja/msg02744.html
参考になる?

209 :nobodyさん:04/02/11 00:01 ID:???.net
Namazuで検索サイトやろうかな。

210 :nobodyさん:04/02/13 03:38 ID:jCzy8g3E.net
質問です。
2chの過去ログを検索出来るようにしていますけど
ファイル数17万程度でインデックス作成に取り組んでいるのですけど
3日経っても終わりません。。おかしいと思いこちらに来ました。
もっと処理を早くしたいのですが、、

一応何を書けばいいのかわかりませんが、
PCのスペック等を簡単にまず記します。
何か必要な設定項目を書けと言われればすぐ書きますので、、
CPU P3-1G@dual
mem 1G
namazu ver2.0.12
perl 5.6

設定ファイルの中身を弄ればいいのでしょうか。。
一応インデックス書き出しは行われ続けていますけど
遅くて遅くて、、、
何かヒント等くれる方いらっしゃいませんでしょうか、、、?

211 :210:04/02/13 03:45 ID:jCzy8g3E.net
OS windows2000 sp3
KAKASI使用

mknmzrc設定
$ON_MEMORY_MAX = 5000000;
$FILE_SIZE_MAX = 10000000;
$TEXT_SIZE_MAX = 1000000;
$WORD_LENG_MAX = 128;
$INVALID_LENG = 128;
$MAX_FIELD_LENGTH = 200;
$WAKATI = $KAKASI;

とりあえずon memory maxの値が小さいのはわかったのですけど
これが速さに関係するのかは理解出来ませんでした。
また、他に問題点や気づく点等がありましたら教えて欲しいです、、


212 :nobodyさん:04/02/13 08:37 ID:???.net
処理能力にはディスクI/Oという重要なファクターもある。
一気にmknmzするのではなく、分割してmknmz→マージする。
そうすれば処理時間もだいたい想像できる。

213 :210:04/02/13 13:43 ID:wO1Lum8s.net
>>212 ヒント有難う御座います!
   少しそれについて調べてみます。

214 :森の妖精さん:04/02/16 02:31 ID:/mo58UcM.net
http://geta.ex.nii.ac.jp/

GETAのPHPインタフェイス作ろうという奇特な御仁は
いらっしゃいませんか?

215 :nobodyさん:04/02/20 12:32 ID:???.net
検索エンジン作成に関してのスレを
こちらにまとめました。

検索エンジンをつくりたい
http://pc2.2ch.net/test/read.cgi/php/1009030584/l50

216 :nobodyさん:04/03/24 21:59 ID:???.net
これ誰かお願いします
http://pc3.2ch.net/test/read.cgi/unix/1075033822/576
Java の API のリファレンスを Namazu でインデックス化していて
Emacs でプログラミング中にカーソル上のクラス名ですぐ検索したいんです

217 :nobodyさん:04/03/31 21:28 ID:???.net
Namazuでインデックス化をして検索をしようと思ったら
「現在-3の文書がインデックス化され、・・・」と文書の数がマイナスになっています。
どうしてなのでしょうか。

218 :nobodyさん:04/03/31 21:46 ID:5e+SzBpf.net



219 :(´・ω・`):04/04/01 21:05 ID:98Q5EoMa.net
どなたかPHPスクリプトで動く
日本語全文検索エンジンソフトウェアを教えてください。

220 :nobodyさん:04/04/02 00:02 ID:n5mwBUCQ.net
4/1にNamazuの新バージョン出るんじゃなかったっけ?

221 :nobodyさん:04/04/02 22:28 ID:???.net



222 :nobodyさん:04/04/20 23:55 ID:hVBcQucn.net
Namazu 2.0.13-1 を公開age

223 :nobodyさん:04/05/01 23:15 ID:HE2QfFBX.net
kakasiについて質問です。

自分で作った辞書を、追加した。

# mkkanwa kanwadict (追加した辞書ファイル)

自分で追加した辞書の内容は、
上記の場合、(追加した辞書ファイル)を参照すれば分かるけど、
現在の辞書全体にどのような単語が登録されているかを調べるにはどうしたらいいんでしょうか?

kanwadictって、viで開くと文字化けして見れません。
※環境:UNIX

224 :nobodyさん:04/05/27 15:51 ID:CEx1TsW7.net
http://www.namazu.org/
にアクセス気出ません

225 :nobodyさん:04/05/27 16:43 ID:mtXfTMbY.net
>>224
orz

226 :nobodyさん:04/05/27 16:43 ID:???.net
今見たら面白いことになってるな

227 :nobodyさん:04/05/27 16:57 ID:???.net
>>224
何かあったの?
クラックされてたとか?

228 :nobodyさん:04/05/27 19:56 ID:WJMdSqlX.net
namazu.orgサーバに不正侵入、サービス停止

全文検索システム「Namazu」を配布するNamazu Projectは5月27日、
同プロジェクトのサーバが不正侵入を受けたと発表した。

http://headlines.yahoo.co.jp/hl?a=20040527-00000016-zdn_n-sci

229 :nobodyさん:04/05/28 21:23 ID:???.net
マジかよ・・・

230 :nobodyさん:04/05/28 21:24 ID:???.net
マジかよ・・・

231 :nobodyさん:04/05/28 21:26 ID:???.net
マジかよ・・・

232 :nobodyさん:04/05/28 21:28 ID:???.net
マジかよ・・・

233 :nobodyさん:04/05/28 21:29 ID:???.net
マジかよ・・・

234 :nobodyさん:04/05/28 22:17 ID:???.net
うわっ・・・5重に書き込んじまったよorz

235 :nobodyさん:04/05/29 00:22 ID:???.net
>>229-233
今回の2ch不調で俺が見た多重で最高だw

236 :nobodyさん:04/05/29 19:09 ID:???.net
>>235
8連投した神もいたぞ。

237 :nobodyさん:04/05/30 20:09 ID:WmFD3m1t.net
Windowsバイナリは????

238 :nobodyさん:04/06/02 02:08 ID:???.net
>>229-234
ワロタ

239 :nobodyさん:04/06/17 19:14 ID:KtXfrXmS.net
人がいないので話題をふってみる

検索結果について質問なんですけど
ttp://www.kaiho.mlit.go.jp/cgi-bin/namazu.cgi?query=%8B%DF%8AC&max=20&result=normal&sort=score
↑こんな風に検索語句と該当箇所が赤く強調されるのってどうやるんですか?
ttp://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?key=a&submit=%B8%A1%BA%F7%B3%AB%BB%CF%21&whence=0&max=20&format=long&whence=0&dbname=reiki
自分のは↑こんなふうに参照したページの上部しか表示されません。



240 :nobodyさん:04/06/17 21:45 ID:???.net
正常に赤強調されるけど?
http://www.city.katano.osaka.jp/cgi-bin/namazu.cgi?query=%B8%F2%CC%EE&whence=0&max=20&result=normal&sort=score&idxname=reiki

NMZ.headにデフォルトで strong.keyword { color: Red; } あるから、
「ちゃんとしたキーワード」なら赤くなるハズ。

241 :nobodyさん:04/06/18 00:33 ID:???.net
>>240
本当だ・・・キーワードの入れ方がまずかったようです。
自分のnamazuでやり直したらちゃんと表示されました。
無知で申し訳ありません。

242 :nobodyさん:04/06/28 15:24 ID:???.net
Perl版Namazuをレン鯖に置いてみましたが、
全角文字で検索すると検索語が”%a5%d0%a5%”みたいな感じで文字化けします。
検索結果画面はきちんと表示されますが、検索文字列だけが化けています。

もう一回全角で検索すると文字化けが直ります。1回目だけ必ず文字化けします。
何が原因でしょうか?

243 :nobodyさん:04/06/28 15:25 ID:???.net
↑うわ、UNIX板に書くつもりだったのに間違えた

ごめんなさい、無視してください。

244 :nobodyさん:04/07/16 18:31 ID:???.net
検索は問題なく出来るのですが、
ヒットしたファイルが日本語のファイル名だと、
ブラウザ上に表示されているファイル名を
クリックしてもファイルをオープンしません。

検索対象ファイルの、
ファイル名が日本語でも対応してますか?
ちなみにWindows版(2.0.12)です。

245 :nobodyさん:04/07/19 00:54 ID:???.net
http://suwako.plala.jp/pukiwiki/index.php?%5B%5BPHP%A4%C7Namazu%5D%5D
↑ここ見てnamazuの全文検索システムのソースを入れてみたら
無事に検索は出来るんですが検索された先のリンクがなぜか全てnamazu.phpがある
カレントディレクトリになってしまいます。
これはどうすれば対処することが出来ますかね?

246 :nobodyさん:04/07/19 12:51 ID:???.net
.namazurc弄ればいんでない

247 :245:04/07/22 13:31 ID:???.net
namazurcの48行目にあるReplaceを参考サイトを見ながら
いじってみましたがやはり結果は同じです。
一体どこがおかしいんだろう?
例えばnamazu.phpをC:\homeに置いたら
検索結果はちゃんと表示されるんですがリンクが全て
namazu.phpを置いているディレクトリになってしまいます。(この場合はC:\home)
変えるべきところはnamazurcのReplaceのところとは思うんですが
何度変えても同じ結果になってしまいます。
どうすればちゃんとしたリンク先になってくれるかな?

参考にしたサイト↓
http://ponx.s5.xrea.com/hiki/ja/hiki.cgi?xrea_tdiary_namazu
http://you-like.to/nekomimi/works/w2k20001110.html

248 :nobodyさん:04/07/22 14:11 ID:???.net
>>247
何でだろうね?ところで自鯖でやってるの?

249 :nobodyさん:04/07/31 19:38 ID:???.net
Replace A(インデックス作成時のパス) B(Aを置換したい文字列)

だよね。ちゃんとそうなってる?
 

250 :nobodyさん:04/07/31 19:44 ID:???.net
pnamazu.cgiの検索結果に表示される「著者」の欄がウザイのと、
この欄の ${author} が一体何を表示するのかがわからないので
ソースを追跡してみたのですが自分には具体的に読み解くことができませんでした。

sub field_init {
%FieldAlias = (
'author' => 'from' ,
'title' => 'subject' ,
'url' => 'uri' ,
);
あたりまではなんとなく分かるんですが・・・

Perlのすごい人! だれか教えて!

251 :nobodyさん:04/08/02 08:46 ID:???.net
著者を消したいだけなら NMZ.result をいじったほうが早いよ。
著者がなにかを知りたいんだったらpnamazuではなく、mknmzのほうを解析するよろし。

252 :nobodyさん:04/08/12 09:03 ID:???.net
.namazurcで

Replace /index.html /
Replace /C\|/namazu/nurupo/ http://hoehoe.ne.jp/~nurupo/

と、2つの置換を行いたいのですが、当然できません。
正規表現が使えるみたいなことが書いてありますが

Replace /C\|/namazu/nurupo/(.+)/index.html http://hoehoe.ne.jp/~nurupo/$1/

では全てが http://hoehoe.ne.jp/~nurupo/$1/ にされてしまいます($1が展開されない)

どうやればこの置換を実現できるのでしょうか?

253 :nobodyさん:04/08/12 09:05 ID:???.net
む?もしかして$1じゃなくて\1なのか・・・?そうなのか・・・?

254 :nobodyさん:04/08/12 09:07 ID:???.net
ああ・・・やっぱ\1でも駄目だ・・・いったいどうすれば・・・

255 :nobodyさん:04/08/21 22:26 ID:???.net


Namazuの検索結果って、
全部ドキュメントの行頭あたりしか表示しないけど
Googleみたいにマッチした前後の文章を表示できんの?


256 :nobodyさん:04/08/22 16:46 ID:???.net
>>255
できない。
レスポンスを重視した結果、今の仕様になっていると思われる。

257 :nobodyさん:04/08/22 19:58 ID:???.net
>>255
Googleっぽい動作が希望なら
Estraier使ってみるとか

258 :nobodyさん:04/08/23 22:59 ID:???.net
Estraier はNamazu ほど敷居は低くないよなぁ・・・
>>255 有りものの中でなら msearch がお勧め

259 :nobodyさん:04/08/24 01:13 ID:202RVh+S.net
そういや微妙に商用はいってる2ちゃん検索もmsearch使ってるっぽいな。
http://find.2ch.net/

260 :nobodyさん:04/08/24 06:48 ID:???.net
CGIで複数の基本インデックスの指定は不可?
F:\index
   +aaa
     +001
     +002
     +003
   +bbb
     +001
     +002
     +003
aaaとbbbを指定したいのだが…
ぐぐたら無理ぽいな
ttp://search.luky.org/vine-users.2/msg02960.html

261 :nobodyさん:04/08/24 19:02 ID:???.net
001とか002とかもインデックス?

javascriptとかでチェックボックスをコントロールするとかじゃ駄目か。

262 :nobodyさん:04/08/24 22:09 ID:???.net
多分無理かな。以下のようにcccを指定する
じゃダメ?

F:\index
  +ccc
   +aaa
   +bbb

263 :nobodyさん:04/08/25 01:35 ID:???.net
>>261-262
数字のフォルダがインデックスで大まかに分けてある。
やはり1つのフォルダ以下にインデックスの入ったフォルダを置くしかないのか。

264 :nobodyさん:04/11/11 11:45:47 ID:VoJd1QOh.net
インデックスと結果表示をutf8でできないでしょうか…

265 :nobodyさん:04/11/23 11:20:19 ID:???.net
本家のperl版まだー?

266 :nobodyさん:04/11/26 13:50:33 ID:cbW9i0f7.net
お聞きしたいのですが…

wgetで落したHTMLファイルをNamazuで検索しています。
Namazuの検索結果の順番を自分で決めたいんですが、
NMZ.field.uriの順番をいじると全てのページがNOT FOUNDになってしまいます。

どなたかいい方法知りませんか?

267 :nobodyさん:04/11/26 14:41:22 ID:???.net
インデックスの作成を速くする方法ないですか?
namazuはcなのにmknmzはperlなのはどうして?

268 :nobodyさん:04/11/26 14:55:11 ID:???.net
>>267
インデックスの作成を早くするには分散して作成してからマージすればよいかも。

namazuがcなのはcの方がリクエストの度にコンパイルがない分、早いから、
mknmzはインデックス作る時しか使わないので文字の操作が楽チンなPerlを・・・。
ちなみにpnamazuっていうPerlで書かれたnamazuもある。
たしか2chもread.cgiはCだけど、bbs.cgiはPerlだったと思う。

質問は一個ずつにしてね。


269 :nobodyさん:05/01/02 10:01:19 ID:Oo1G9Jag.net
とりあえずローカルで動かそうと思ったんですが、どうしてもインストールが
うまくいきません。
インデックスを作ろうとするとNKF.pmが無いといわれます。
PPM-INSTALL.BATを動かしてもうまくいきません。どうすればいいのでしょうか?

270 :269:05/01/02 12:42:33 ID:???.net
すいません、自己解決しました。

271 :nobodyさん:05/01/27 22:35:38 ID:muSCpH63.net
一日費やして何とかNamazuをサーバーでうごかせれるようになったレベルなんですが、これでñとかóのような外国語をブラウザから検索してみると激しく文字化けしてしまいます。
なんか改善する術ってありますでしょうか? 教えて誰かエロイ人!!

272 :nobodyさん:05/02/11 17:47:10 ID:LfkZHaha.net
namazuのwin32版をインストールしたのですが、mknmzrcの$ALLOW_FILEのところで、
2行目以下のwordなどの設定が対応メディアタイプに反映されません。
2行目以下も#は外しているのですが…。
茶筌のところ#を残しているのですが、それもちょっと変かもです。
うまくいかない原因がわかる方どなたか教えてください。

読み込んだ設定ファイル: D:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: D:/namazu/etc/namazu
LIBDIR: D:/namazu/share/namazu/pl
FILTERDIR: D:/namazu/share/namazu/filter
TEMPLATEDIR: D:/namazu/share/namazu/template
対応メディアタイプ:
application/x-gzip
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml

273 :nobodyさん:05/02/11 19:36:57 ID:???.net
>>272
まず最新の2.0.14を使いましょう。
それと
D:/namazu/etc/namazu/mknmzrc の$ALLOW_FILE
のところを全行はりつけてよ。
どこの#を外したのか見てみないとわからんよ。

274 :272:05/02/11 19:40:50 ID:???.net
>>273
最新って言ってもベータ版らしいので…。
とりあえずこんな感じです。

#
# This pattern specifies file names which will be targeted.
# NOTE: It can be specified by --allow=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$ALLOW_FILE =".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
"|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf|.*\\.ps" . # PDF, PostScript
"|.*\\.tex|.*\\.dvi" . # TeX, DVI
"|.*\\.rpm|.*\\.deb" . # RPM, DEB
"|.*\\.doc|.*\\.xls|.*\\.ppt" . # Word, Excel, PowerPoint
"|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8
"|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man



275 :nobodyさん:05/02/11 19:43:44 ID:???.net
あれ?連続する半角スペースとタブが消えるのは2ちゃんの仕様でしたよね。

276 :nobodyさん:05/02/11 19:49:17 ID:???.net
>>274
Windows版はβ版扱いになっていますが、
インストーラがβというだけで本体に問題はないですよ。

たぶんフィルタが必要としているMS-Word等の
アプリケーションが入っていないのでしょう。

こちらのフィルタを使うとよいでしょう
ttp://www.geocities.co.jp/SiliconValley-Oakland/8718/namazu/index.html


277 :nobodyさん:05/02/11 19:53:07 ID:???.net
関係ないが消えるのはタブだけ。

278 :272,274:05/02/11 20:00:49 ID:???.net
そういえば2.0.12は2002年か…。
Office2003だということもあるのかな。
拡張子だけで判断してるのではないんですか。
まずは最新版をインストールしてみます。
用事があって今日これからはできないので、うまくいかなかったらまた後日質問させてもらいます。
回答ありがとうございました。

279 :nobodyさん:05/03/10 15:52:52 ID:???.net
Redhat9、namazu2.012にて全文検索システムを作成しています。
ページが増えてきたので階層ごとにインデックスを作成し階層ごとに検索ページを
作りたいと考えております。しかしインデックスファイルを作成しnamazuコマンドでは
検索できるのですがブラウザから
http://サーバIPアドレス/cgi-bin/namazu.cgi?idxname=aaaとすると
allインデックスから検索されてしまいaaaインデックスから結果を表示してくれません。
aaaインデックスから結果を表示するにはどのようにするのでしょうか?

ページの階層
/apache/htdocs/aaa
/apache/htdocs/bbb
/apache/htdocs/ccc

インデックスの格納場所
/apache/cgi-bin/namazu/index/all
/apache/cgi-bin/namazu/index/aaa

index/all内のNMZ.head.ja
<input type="hidden" name="idxname" value="all"> ←allに変更
<a href="{cgi}?idxname=all">[検索方法]</a> ←?idxname=allを追加

index/aaa内のNMZ.head.ja
<input type="hidden" name="idxname" value="aaa"> ←aaaに変更
<a href="{cgi}?idxname=aaa">[検索方法]</a> ←?idxname=aaaを追加

cgi-bin内にある.namazurc
Index /apache/cgi-bin/namazu/index
Template /apache/cgi-bin/namazu/index/all
Replace /apache/htdocs/ http://サーバIPアドレス/

280 :nobodyさん:05/03/10 22:40:21 ID:???.net
>>279
mknmzの内容教えれ

281 :279:05/03/11 09:08:13 ID:???.net
ご返答ありがとうございます。mknmzの結果は下記の通りです。

mknmz -O /apache/cgi-bin/namazu/index/all /apache/htdocs
合計の文書数 602
合計キーワード 5,499
わかち書き module_kakasi -ieuc -oeuc -w

mknmz -O /apache/cgi-bin/namazu/index/aaa /apache/htdocs/aaa
合計の文書数 9
合計キーワード 441
わかち書き module_kakasi -ieuc -oeuc -w

よろしくお願いします。

282 :279:05/03/11 16:15:26 ID:8QvGuHRh.net
こっちですね。
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff

283 :279:05/03/11 16:20:49 ID:???.net
すいません。間違えました。
mknmz -C
読み込んだ設定ファイル: /etc/namazu/mknmzrc
システム: linux
Namazu: 2.0.12
Perl: 5.008
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: no
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.eucJP
言語: ja_JP.eucJP
文字コード: euc
CONFDIR: /etc/namazu
LIBDIR: /usr/share/namazu/pl
FILTERDIR: /usr/share/namazu/filter
TEMPLATEDIR: /usr/share/namazu/template
対応メディアタイプ:
application/pdf
application/x-bzip2
application/x-compress
application/x-gzip
application/x-rpm
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; xtype=rfc
text/x-hdml
text/x-roff

284 :nobodyさん:05/03/12 00:24:13 ID:???.net
>>279
Template /apache/cgi-bin/namazu/index/all
としているから
常に index/all内のNMZ.head.ja
が読み込まれているということでないか
namazurcのTemplateの行をコメントアウトしてみたら

285 :nobodyさん:05/03/17 23:30:42 ID:???.net
>>279
亀レスだけど、
Namazuでは 「/cgi-bin/namazu.cgi?idxname=aaa」 みたいな直接指定はNGだったはず。
きちんとhiddenとかから送らないと。

286 :nobodyさん:2005/03/22(火) 21:53:42 ID:???.net
>>285
それってどこでNGにしてるんでしょ。Namazu本体じゃなくて
pnamazuとかインターフェースのところでやってるんですよね。

287 :279:2005/03/30(水) 18:10:10 ID:???.net
>>284-286 ありがとうございます。
検証が遅くなり申し訳ありませんでした。
サーバIPアドレス/cgi-bin/namazu.cgi?idxname=インデックス名&query=キーワード
で検索したらうまくできました。htmlにhiddenで指定した場合もOKでした。
ご教授ありがとうございました。
しかし検索結果はOKなのですが、aaaインデックスを検索しても結果はOKなのですが
ヘッダーの部分がallのもので表示されてしまいます。
(現在602 の文書がインデックス化され5,499 個のキーワード)
検索結果ページから再検索するとあるはずのページでも検索できません。
(allインデックス及びaaaインデックス両方とも。インデックスネームがうまく指定されない為?)
namazurcのTemplate部分をコメントアウトするとインストール時?の古いインデックスが
表示されてしまいます。
複数インデックスがある時のTemplate指定はどのように行っているのでしょうか?

288 :nobodyさん:2005/03/31(木) 00:35:45 ID:???.net
>>287
Templateが選択される順序は説明書にあるとおり
http://www.namazu.org/doc/manual.html#form-idxnames
再検索をする際にWebブラウザで表示ページのソースを調べて
どのNMZ.headが読み込まれているか確かめてはどうですか。

289 :nobodyさん:2005/11/11(金) 14:19:22 ID:lZiu1JMN.net
会社で鯰使うらしいので、オフィとか見てみました。
日本語全文検索ってほぼGoogleでカバーできてるのでは?
Winではあまり普及していないらしいし、導入に面倒がありそうだし
今、敢えてNamazuで検索を作るうまみってなんですか?

290 :nobodyさん:2005/11/11(金) 20:34:38 ID:???.net
んーどうだろう

291 :nobodyさん:2005/11/12(土) 23:40:29 ID:???.net
Googleはイントラネット内も検索できるようになってんですかそうですか

292 :nobodyさん:2005/11/13(日) 06:11:00 ID:???.net
>>289
イントラの情報を検索できること
検索結果画面をカスタマイズできること
カテゴリ検索ができること
文書の最終更新日をファイルスタンプから識別できること

293 :nobodyさん:2005/11/13(日) 08:31:58 ID:???.net
今使うならnamazuじゃなくHyper Estraierにするな. 俺なら.

294 :nobodyさん:2005/11/13(日) 15:52:29 ID:???.net
>>293
そのソフト最近人気らしいけど、Namazuに比べてどの辺が優れてるの

295 :nobodyさん:2005/11/14(月) 10:06:19 ID:???.net
>>291-292
なるほど、イントラ内検索がGoogleにはないうまみっぽいですね。
だんだん鯰の位置づけがおぼろげながらわかってきました。
どうもありがとうございます。

296 :nobodyさん:2005/11/14(月) 12:47:16 ID:???.net
Namazuだったら正規表現も使えるんじゃない?
あれは便利だお。

297 :nobodyさん:2005/11/14(月) 16:16:53 ID:???.net
正規表現はすばらしい

298 :nobodyさん:2005/11/16(水) 14:03:06 ID:???.net
(i)←こういうやつ?<性器表現

299 :nobodyさん:2005/11/17(木) 13:26:17 ID:???.net
   〃∩ ∧_∧
   ⊂⌒(  ・ω・)  はいはいわろすわろす
     `ヽ_っ⌒/⌒c
        ⌒ ⌒

300 :nobodyさん:2005/11/18(金) 11:32:18 ID:ngwfG4IK.net
namazuのなんかのバージョンで、検索指定した文が
ハイライトされて、(そのページの上のほうからのテキストだけでなく)
検索された部分が表示されるというやるがあるらしいよ

と先輩に言われたのですが、どこにありますか?
あるいはカスタマイズで処理するもんなのですか?
教えてください。

301 :nobodyさん:2005/11/19(土) 03:18:32 ID:???.net
>>300
EmphasisTags じゃなくて?

302 :nobodyさん:2005/11/21(月) 10:11:48 ID:T4fDN5+G.net
>>301
ありがとうございます、調べてみます。(`・ω・´)ゝ

303 :nobodyさん:2005/11/21(月) 10:27:34 ID:T4fDN5+G.net
やってみましたが、どうも指示されたものと違うようです。

たとえば文中にキーワードがヒットしても、プレビューで表示されるのは
そのページの文頭から指定文字数分ですよね?
それを、キーワードの該当部分前後をプレビューに表示させたい
という話でした。

304 :nobodyさん:2005/11/25(金) 10:08:55 ID:???.net
>>303です。
指示者がEstraierと混同していた可能性大です。
自己解決しました。どうもありがとうございました。

305 :nobodyさん:2005/12/14(水) 20:47:34 ID:CwjBoKRv.net
Namazu はPerlだけでしょうか?
できればPHPでサイト内検索ができるスクリプトをご存知でしたら教えてください。


306 :nobodyさん:2005/12/15(木) 02:53:07 ID:???.net
>>305
ネタっすか
っ[google]

307 :nobodyさん:2005/12/15(木) 05:07:22 ID:???.net
>>305
Namazu自体はPerlじゃないし。

308 :nobodyさん:2005/12/16(金) 05:48:32 ID:+W2Wi6VX.net
な、なんだとーこのこのー

309 :nobodyさん:2005/12/16(金) 11:56:00 ID:???.net
Namazuと言えばみみずんの2ちゃんねる過去ログ全文検索システムだな。
って思ったら>>30に書いてあった・・・

310 :nobodyさん:2006/01/16(月) 09:59:58 ID:rhuM8+qJ.net
現在phpから動的にページを生成して出力しているのですが、
このPHPから出来上がるページをnamazuで検索したいと思っています。
どのような手法がありますでしょうか?

311 :nobodyさん:2006/01/16(月) 11:43:50 ID:???.net
その動的に出力してるやつを静的なHTMLとして書き出す。

312 :nobodyさん:2006/01/16(月) 13:00:54 ID:rhuM8+qJ.net
動的なページを静的HTMLとして書き出してインデックス化するような処理をnamazuの方で出来ますか?
それとも、やはりこちら側であらかじめ静的ページを作っておいて、それをインデックス化するしかないでしょうか?
なんとかコマンド一発で出来ませんかね?

313 :nobodyさん:2006/01/16(月) 17:28:20 ID:???.net
wget -> namazu
っていうシェルスクリプト書けば一発でしょ。


314 :nobodyさん:2006/01/16(月) 20:36:24 ID:???.net
Namazuはファイルのインデキシングを行うのみ。
動的なページをインデックスするには
http://pc8.2ch.net/test/read.cgi/unix/1113150661/116

315 :312:2006/01/16(月) 20:44:28 ID:???.net
>>311さん
>>313さん
>>314さん

親切にありがとうございます。
よくわかりました。とりあえずwgetの方法を試してみようと思います。

316 :nobodyさん:2006/01/16(月) 22:22:45 ID:???.net
wget!

317 :nobodyさん:2006/01/30(月) 18:45:25 ID:???.net
キタ━━━(゚∀゚)━━━!!!!

318 :nobodyさん:2006/01/30(月) 21:42:38 ID:???.net
2006-01-29: Namazu 2.0.15 を公開

ISO-8859-* に関する文書の間違いを訂正
RedHat ソフトウェア namazu.spec の不必要なパッチは削除
File::MMagic 1.25 を同梱
MeCab の正式対応
mknmz に -b 及び --use-mecab オプションを追加
mknmz および namazu に --norc オプションを追加
mknmz に --decode-base64 オプションを追加
新しいフィルタ(Gnumeric, Koffice, Mainman/Pipermail, Zip, Visio)を追加
mknmzrc に MECAB, DENY_DDN を追加
ファイル名がDDN である時にスキップ。
日付フィールドによるソート機能の追加
nmzcat, nmzegrep コマンドの追加
フィルタの Windows 対応
(msword.pl, excel.pl, powerpoint.pl, postscript.pl, 等...)
OLE コントロールフィルタ更新
QUERY_STRING の区切りに';' 使用可能
Perl版テストプログラム(pltests) を追加
各種バグフィックス

319 :nobodyさん:2006/01/31(火) 08:21:04 ID:???.net
1年9カ月ぶりなのね

320 :nobodyさん:2006/04/02(日) 12:56:16 ID:6BlopTUr.net
http://www.namazu.org/
は、MacのSafariで見れないのは、なんか理由があるのかな?

321 :nobodyさん:2006/04/02(日) 13:02:03 ID:???.net
>>320
http://www.namazu.org/index.html.ja ならOK
Content-Locationヘッダをうまく扱えてないみたい。
他所ではちゃんとリダイレクトされるんだけど、namazu.orgではNG。なんでだろう?

322 :nobodyさん:2006/04/07(金) 19:28:41 ID:???.net
Namazuをローカルサーバーに組み込みたいのですが
何のファイルをサーバーに送れば良いのか教えてください。

323 :nobodyさん:2006/05/16(火) 22:05:32 ID:A+ClptH/.net
>>322
ttp://www.namazu.org/installation.html


324 :nobodyさん:2006/07/04(火) 21:14:27 ID:t84Vuxwj.net
>305
PHPでnamazu検索???

こんなの??
ttp://www.c-boxs.net/PHP/NamaP/

325 :nobodyさん:2006/09/07(木) 22:19:16 ID:n616cZBc.net
AN HTTPDとnamazuでLAN内のファイルサーバ全文検索システムを構築しました。
この勢いでローカルにある2ちゃん専ブラのdatファイルもインデックス化したいんですけど
良い文書フィルタはありませんか?

326 :nobodyさん:2006/09/07(木) 22:22:28 ID:???.net
>>325
自分で作ったほうが出来がいいぞ

327 :nobodyさん:2006/09/08(金) 09:21:57 ID:???.net
>>325
っていうか2ちゃんにどっぷりハマってるような
人間のクズは氏んだほうがいいぞ。

専ブラ+dat保存なんて、何をたくらんでいるのやら・・・おー、こわ。

328 :nobodyさん:2006/09/08(金) 14:34:10 ID:???.net
にくちゃんねる2号だろ

329 :325:2006/09/08(金) 20:52:20 ID:???.net
>>327
単なるナレッジ・マネジメント・システムの構築を目指してるだけですよ。
「おーこわ」って・・・なにを勘繰ってんですか

330 :nobodyさん:2006/09/29(金) 14:11:41 ID:MXN7wOzE.net
namazuがN-gram対応

331 :nobodyさん:2006/09/29(金) 21:56:15 ID:???.net
>>330
しないよ

332 :(^-^) ◆MONSOON/qo :2006/10/08(日) 05:28:42 ID:aDf/+h/t.net
インディックス作成時に読み込む文字種を正規表現で指定できますか?
記号は除外するとかです

333 :(^-^) ◆MONSOON/qo :2006/10/08(日) 05:39:20 ID:aDf/+h/t.net
自己解決しました

334 :nobodyさん:2006/10/10(火) 01:41:58 ID:???.net
>>333
http://pc8.2ch.net/test/read.cgi/unix/1113150661/195-197

マルチで「自己解決」とは笑わせてくれるな

335 :nobodyさん:2006/10/13(金) 09:24:55 ID:???.net
こいつの検索判定明らかにおかしい。
何でもそうなのだが、部分一致ができない。

ファッキントッシュは、バカの使うOS

を検索するとする

「ファッキン」で検索すると一致なし
「ファッキントッシュ バカ」 で検索しても一致せず
「ファッキントッシュはバカの使うOS」でやらないと一致しない。

まるでMSNの検索エンジンだ
あれとまったく同じ

336 :nobodyさん:2006/10/13(金) 15:19:49 ID:???.net
ファッキン!

337 :nobodyさん:2006/10/13(金) 20:45:51 ID:???.net
>>335
HyperEstraier いれろよ。こっちの方が簡単だよ。
検索漏れもないし。

338 :nobodyさん:2006/10/14(土) 00:11:41 ID:???.net
>>335
「ホントかよ」とおもったんで、試してみたけど、ヒットするよ。
プレーンテキストで「ファッキントッシュは、バカの使うOS」と書いて
最後に改行して保存。

> まるでMSNの検索エンジンだ

というが同エンジンと思われる「Windowsデスクトップサーチ」でも問題なくヒットした。
Hyper Estraierでももちろんヒット。

>>335の環境がおかしいんじゃないのか?

339 :nobody:2006/10/25(水) 22:26:22 ID:J6B8Hktu.net
Windows ,PHP5に対応したPHPのNamazuモジュールを使いたいのですが、
どうやってモジュールをインストールするのか良く分かりません。
よろしければ、手順を教えていただけないでしょうか?


340 :nobodyさん:2006/11/20(月) 17:03:35 ID:???.net
>>339 PHPライセンスとGPLライセンスが衝突するので
自分でモジュールをコンパイルするしかないです。

www.mail-archive.com/namazu-users-ja@namazu.org/msg00374.html

341 :nobodyさん:2007/02/08(木) 12:03:48 ID:Mb2H3yQx.net
保守

342 :nobodyさん:2007/03/22(木) 22:02:22 ID:???.net
Namazu用のWEBクローラはないの?
あと、インデクサや検索エンジンの分散処理ってどうやるのですか?
どっちもHyperEstraierでは標準で付属してるよね

343 :nobodyさん:2007/03/22(木) 23:21:03 ID:???.net
ない

344 :nobodyさん:2007/03/22(木) 23:25:45 ID:???.net
じゃメタ検索は?
Namazuサーバを複数稼働させといてクライアントで検索結果をマージできるシステムとか
ないの?

345 :nobodyさん:2007/03/23(金) 00:11:38 ID:???.net
検索結果をマージして使っている例もあるようだ
ttp://www.hpcss.is.ritsumei.ac.jp/Essay/2005/thesis/pdf/ohsaki.pdf

346 :nobodyさん:2007/05/11(金) 16:16:19 ID:???.net
windows版のnamazuでmknmzでイントラネット内の共有ディスクの
インデックスを作ると、終了できてないと思われるwordやexcelの
プロセスがガンガンできるんですけど解決方法はありますか?

347 :nobodyさん:2007/05/11(金) 23:54:36 ID:???.net
xdoc2txt.exe を使え

348 :nobodyさん:2007/08/22(水) 06:00:29 ID:XEGA28iC.net
インデクスの中から登録キーワードの一覧を取得したいのですが
ファイルを開くことすらままなりませぬ(Cの知識皆無・・・
PerlかRubyからアクセスする方法を探してるんだけど
説明のあるページなどご存知の方いませんか?

349 :nobodyさん:2007/08/22(水) 21:34:30 ID:???.net
>>348
www.namazu.org/doc/nmz.html.ja#w
に書いてあるとおり単なるテキストファイルに
1行に1単語で書かれているだけ


350 :348:2007/08/23(木) 00:04:33 ID:???.net
>>349
このページは見ていませんでした。(トップページからリンクされてない?)
片っ端からファイルを見ていって、
開くことができたファイルの内容をチェックしていたんですが見落としてました。
ありがとうございました!

351 :nobodyさん:2008/02/20(水) 20:07:39 ID:fLDVdokd.net
100MB強のPDFをインデックス化しようとするとmknmzが動作を停止する。なんでだ。
mknmzrcには200MBまでを検索対象にするよう設定してるんだが。

352 :nobodyさん:2008/02/21(木) 22:15:05 ID:7VDtsl8S.net
>>351
メモリじゃん?

353 :nobodyさん:2008/02/22(金) 01:51:00 ID:CRNkbfG6.net
メモリか。xpdfは王様プログラミングで作ってあるのか。。


354 :nobodyさん:2008/03/27(木) 06:31:14 ID:???.net

あえてNamazuを使いたいのであれば構わないけど、
良い子は「Hyper Estraier」を使いましょう。

http://pc11.2ch.net/test/read.cgi/unix/1176807372/l50

355 :sfOdHWpuZpBZYiqez:2008/06/13(金) 21:05:42 ID:???.net
v2EQ8I <a href="http://npiriddqxmjg.com/">npiriddqxmjg</a>, [url=http://snsxeffarbil.com/]snsxeffarbil[/url], [link=http://pribjbixlijw.com/]pribjbixlijw[/link], http://qczemfzbhofm.com/

356 :nobodyさん:2008/07/19(土) 19:10:35 ID:Hdkv0asv.net
検索結果に出てくる数字が1000の区切りでカンマが入るのは止めようがありませんか?
「1000」が「1,000」と表示されないようにしたいのです。

357 :nobodyさん:2009/07/30(木) 06:41:54 ID:???.net
当方、急に鯖管理をする事になった者なのですが、
いきなりよく分からない壁に当たりましたので教えて下さい。
namazu自体よく分かりませんので、手探りでやっています。
色んなサイトを見て見た結果、とりあえずnamazu.cgiを
見てみないと始まらないようなのでftpでダウンロードしてみました。

ところが、namazu.cgiを開いたら文字化けが酷くて読めません。
使ってみたソフトはjeditx あとは、miです。

どうしてこういうことになったのでしょうか。
namazu.cgiが読めないとインデックスの更新もできない
ようなので先に進めない、と思われるのですが、
どなたか読む方法をご教授下さい。


358 :nobodyさん:2009/07/31(金) 00:09:56 ID:???.net
>>357
首を吊るか、辞表を書け。さもなきゃ、人を雇え。


359 :357:2009/07/31(金) 01:45:58 ID:???.net
その「雇っていた人」が降りたので、倅の自分に
無茶振りで回って来ました。なのでショッピングカート
(詳細なcgi部分を除く)とサイトいじりまでくらいしか
分からないです。
namazu.cgi自体はおまけでついて来るものだということは
色んなサイトを見て雰囲気で今日分かりました。

そもそもnamazu自体は、レンタルサーバにインストール
されているべきなのか、自分のpcにインストールされているべきなのか
それも分かりません。とりあえず、コンソ−ルからftpで入って、
フィルタに使うファイルがたくさん有るディレクトリでmknmzをしても
動かなかったので、namazuのインストール自体はサーバではなくて、
本体にすると言うことでしょうか?ネットを調べても
自サーバメインのチュートリアルが多くて困っています。

とりあえずインデックスを更新するだけで良いです。
そもそもいきなり分かる訳が無いので多くは望んでいません。
人名の間違い登録は流石に放置できないので、質問した次第です。

大真面目なので、申し訳ありませんがよろしくお願い致します。



360 :nobodyさん:2009/08/01(土) 00:19:11 ID:???.net
>>359
ttp://www.amays.com/~mizusawa/namazu_kaisetu/

361 :nobodyさん:2009/08/06(木) 13:05:55 ID:???.net
dxfフィルタを導入したかったのですが、ホームページからのリンクが切れてました。
dxf用フィルタはもう配布していないのでしょうか?

362 :nobodyさん:2010/08/12(木) 12:11:44 ID:XzX6VOe9.net
1年ぶりに上げてみる

363 :nobodyさん:2011/12/10(土) 02:14:28.72 ID:???.net
さらに1年四ヶ月

364 :nobodyさん:2011/12/14(水) 21:07:04.55 ID:???.net
牛NASにpnamazu入れようとしたけどよくわからん

365 : 忍法帖【Lv=40,xxxPT】(2+0:8) 【24.8m】 電脳プリオン ◆3YKmpu7JR7Ic :2012/09/17(月) 23:00:05.28 ID:???.net ?PLT(12079)


  ∧_∧
  ( ・∀・)            人 ガッ
  (    つ―-‐-‐-‐-‐-‐○ <  >__Λ∩
  人 Y ノ.             V`Д´)/
  し(_)                  /  ←>>153


366 :nobodyさん:2014/01/22(水) 21:41:46.61 ID:???.net
ぬるぽ

367 :nobodyさん:2015/10/01(木) 01:05:10.45 ID:???.net
Namazu全文検索システム

368 :nobodyさん:2017/08/06(日) 20:33:47.24 ID:???.net
Namazu全文検索システム

369 :nobodyさん:2017/12/30(土) 12:37:01.47 ID:YhlYw6jg.net
誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。

グーグル検索⇒『半藤のブブイウイウレレ』

T97QMNLQDJ

370 :nobodyさん:2018/09/09(日) 18:19:14.30 ID:???.net
ナマズとかWeb1.0時代の化石だな

371 :nobodyさん:2019/03/14(木) 14:11:13.65 ID:???.net
なまずってたいしたことなかった

372 :nobodyさん:2020/02/11(火) 15:35:29.19 ID:???.net
チエオクレのハゲの悲惨なツイッター
https://twitter.com/aphonedollar

  ↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑↑
この自称「ハゲ」とかいうチエオクレのブログが酷すぎる

>「DesktopHE」 はWindows10に対応してないらしい

はぁ??? ★★★大嘘デタラメ★★★を垂れ流すな!!!

■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■
■「DesktopHE」 はWindows10でも、もちろん使えるわ!!!■

チエオクレのハゲが、Javaの設定を失敗してるだけじゃねえか!!!
嘘デタラメ垂れ流しやがって、このハゲがやっていることは立派な公害じゃねえか!

hatenaとかでまで、必死こいて大嘘をばらまいているんだが  
(deleted an unsolicited ad)

373 :nobodyさん:2021/01/24(日) 03:51:52.78 ID:6vLPbUCtA
「フリーランススタート」の掲載案件数、累計16万件を突破
https://codezine.jp/article/detail/13393
「週3日・社員の6割以上」テレワーク、東京都が要請 ホテルをオフィス代わりに使うと、1カ月100万円補助
https://www.itmedia.co.jp/business/articles/2101/08/news119.html
札幌市のテレワーク導入支援制度 想定上回る申請600件 追加で受け付け中
https://www.hokkaido-np.co.jp/article/499531/
最大45万円を支給!ギフトモール、本社移転および従業員のリモート環境整備を徹底サポート
https://www.jiji.com/jc/article?k=000000015.000048025&g=prt
週半分以上の在宅勤務も可能!大日本印刷が人事制度刷新へ
https://newswitch.jp/p/25098
中小企業がテレワーク導入のために利用できる助成金や補助金の制度があるって知ってた?
https://dime.jp/genre/889307/
テレワーク支援が手厚い会社 vs 全部自腹会社の差がスゴすぎる
https://news.livedoor.com/article/detail/19480387/
【フリーランス・副業の実態調査】転職活動中ではない専業フリーランス、
副業ワーカーの4割以上が、副業を通して転職を検討すると回答
https://prtimes.jp/main/html/rd/p/000000076.000042378.html

374 :白川前日銀総裁を痛烈批判 自民・世耕氏:2023/03/05(日) 18:23:51.13 ID:l72aQz6n.net
自民党の世耕弘成参院幹事長は5日、NHKの討論番組に出演し、日銀前総裁の白川方明氏が黒田東彦総裁の「異次元緩和」を疑問視したことに対し、「白川総裁時代に金融緩和をかたくなに行わなかったことが、深刻なデフレに日本が陥った最大の原因だ」と痛烈に批判した。

 その上で「まずご自身の時代をしっかり総括していただきたい」と語った。

 白川氏は1日公表の国際通貨基金(IMF)季刊誌に「金融政策の枠組みを再考する機は熟した」と寄稿した。

 世耕氏は番組で、次期日銀総裁候補の植田和男氏が国会の所信聴取で示した金融政策に関する見解を評価。「黒田総裁の下の姿勢をしっかり引き継いでくれる」と述べ、植田氏がアベノミクスを継承するとの見方を示した。

 これに対し、立憲民主党の田名部匡代参院幹事長は同じ番組で、2%の物価上昇目標を明記した政府・日銀の共同声明について「見直すべきだ。アベノミクスは既に失敗している」と強調し、金融政策の抜本的な見直しを訴えた。ただ、植田氏の総裁起用人事案については「これから結論を出していく」と述べ、賛否を明らかにしなかった。 

375 :nobodyさん:2023/09/30(土) 00:16:12.96 ID:???.net
ホンマに、こんなとこに店あんのか?

89 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver.24052200