2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

検索エンジンをつくりたい

1 :yam ◆AyW.Rdbg :01/12/22 23:16 ID:???.net
ヤフーのような検索エンジンを作って、
自力で商用化をしたいんだけれど、
開発費用っていくらぐらいかかる?
信頼のおける技術者も探しています。

232 :nobodyさん:2005/06/04(土) 01:31:08 ID:???.net ?##
逆に、アダルトを主体的にデータ化していき、
そこにない差分データはとりあえず非アダルトということに

233 :nobodyさん:2005/06/05(日) 09:34:25 ID:???.net
>>231-232
とりあえず、俺はこの板に来たらなんか書くようにするから
他のみんなもどんどん意見を出して欲しいと思う。

んで、231の方法はmetaとかページのテキストから
アダルト関連のワードを拾うことで、アダルトサイトを
ほぼ完全排除出来ないかな?
最近のサイト制作の傾向として、1つの検索エンジンのみを
対象とした作り方はしないし、どうせYAHOO!やGoogle相手
なんだから、アダルトサイトがアダルト関連のキーワードを
はずせないし。なら、それらのキーワードを禁止指定すると
割と容易にアダルトサイトは排除出来ると思う。

234 :nobodyさん:2005/06/05(日) 09:38:35 ID:???.net
それで次のアイディアだけど、よくあるかもしれないが
それでいて大手検索エンジンで使われていないのだが
ランダム検索と、ソート機能ってあれば面白いと思う。

ランダム検索機能はテキストボックスにキーワードを入れて
「ランダム検索」のボタンをクリックすると、ランダムな
検索結果を表示する。これで下位に埋もれるサイトを
見られる可能性が増える。

次にソート機能は主にタイトルからソートをかける機能。
タイトル以外にも登録日・更新日を昇順・降順出来ることで
タイムリーな記事やサイトを表示させることが出来る。

上記の2機能はディレクトリ型の検索エンジンでも
割と容易に出来る気がする。けど、あまり見かけない。

235 :nobodyさん:2005/06/05(日) 10:29:47 ID:???.net
>>233
まぁ、言っていることは妥当だと思われ
ただ、問題なのはどうやってアダルト関連のキーワードを判断するかだね
人手で作ってちゃ馬鹿だし

ベイジアンフィルタなんてのもあるから
その応用なんだろうけど

236 :nobodyさん:2005/06/05(日) 16:15:38 ID:???.net
>>235
アダルト関連のワードってめちゃくちゃ細かいのも排除するの?
例えば、AV女優の名前とか。

とりあえず、「アダルト」「風俗」「AV」とかそういうおなじみの
ワードを省くだけで良いと思う。管理者が入力するタイプでも。

237 :nobodyさん:2005/06/05(日) 22:44:18 ID:???.net
>>236
っていうか、どこまでをアダルトと認識するかによって異なる
例えば、アダルト:アダルトチルドレンなんて様に
特定のキーワードを含む=アダルトサイト
ってわけにはいかないからね

子供向けのフィルタを作る or 特定の分野に特化する
なら話は違ってくるけどさ

ベイジアンフィルタ=めちゃめちゃ細かいものを排除する
って言うわけではないってことね

238 :nobodyさん:2005/06/06(月) 00:20:28 ID:???.net
>>237
そう言われればそうだよね。AVでもAV機器ってあるしな・・。

とりあえず、+で含まれるワードはどうだろ?
「ホームページ」「制作」でホームページ制作をフィルタするように
「アダルト」+「AV女優」とか加えてフィルタにするとか。

でも、なかなか難しそうだな。なんか騙しリンクとか
そういうのを完全排除出来る、フィルタリング対応検索エンジン
があれば、割と受けると思うんだけどな。

239 :nobodyさん:2005/06/06(月) 12:46:54 ID:???.net
>>238
まぁ、その辺を考えるんなら
既存のフィルタリング技術とかアプリケーションを
調べてみても面白いかも

有害コンテンツを子供に閲覧させないためのフィルタとかね
色んなサービスなんかあるし

240 :nobodyさん:2005/06/06(月) 16:24:02 ID:???.net
とりあえず2ch.netも全カットだなw

241 :nobodyさん:2005/06/07(火) 22:37:09 ID:???.net
参考スレ

超高機能なサーチエンジンを作りたいんだけど
http://pc8.2ch.net/test/read.cgi/tech/1048336478/

242 :nobodyさん:2005/06/13(月) 04:28:42 ID:???.net
スレが進んでるのにびっくりした。

>>223-224
企業的視点であり、自分の意見の欲しい形を言ってないとの事だが、
そうではなく企業ですでに目をつけてるものをやっても仕方ない
と思う反面で、企業体が研究している分野を否定して需要がない所を
掘り込むのもどうかと思う(企業的規模で成功するためにじゃなく、
使ってもらってフィードバックしてもらうってレベルでね)から、
注目されてる一例を出しただけであって、深いとか難しいと思わなかった。
企業的視点と読み取るのは、単語に騙されやすいのではないかと。

で、そこから「何をソースに」「どういう重み付けをするか」 について特色を
出したものが欲しいなってのが俺の意見なわけで、述べてないと読み取るのは
最初から述べて欲しい意見を想定していて、プロテクトしちゃってるから
読み取れないんじゃないだろうか。まあ、俺も>1が01年のスレで一気に具体案まで
提案するのはどうかと、大ざっぱな概念から振ったのは不親切だったと思う。
>231-233で、まずはブレストって事で決着しているが、とりあえずなにやら
へんな読み取られ方してると思ったので訂正しておきたい。

アダルト情報の排除か、それを極めると逆にアダルトの検索エンジンのコア
としても機能しそうだね。ただ、運用したらお役所に睨まれそうだがw
アダルト、アドウェアみたいなデータからNOTで弾くために、エロボットは
必要なのかも知れないな。


243 :nobodyさん:2005/06/14(火) 15:42:03 ID:???.net
>>242
すまん、「何が言いたいか分からない」

244 :nobodyさん:2005/06/15(水) 03:24:42 ID:???.net
みんなに謝らなきゃいけないことがある。

このスレのタイトルを見たとき俺は、、、、、、、






検索ニンジンをつくりたい

かと思ってしまったんだ。すまない。

245 :nobodyさん:2005/06/15(水) 03:46:17 ID:???.net
絶対に許さない

246 :nobodyさん:2005/06/15(水) 06:28:52 ID:???.net
検索エンジンにオークション的機能があっても面白いかも。

247 :nobodyさん:2005/06/15(水) 12:04:53 ID:???.net
>>246
詳しく。

248 :nobodyさん:2005/06/15(水) 19:00:23 ID:SDEIoMgZ.net
俺データベースが苦手で
エクセルのCSVを多様して検索システムをつくった
いまんとこ1000件データをいれてためしたが
結構早く検索する・・どれぐらいたえれるのだろうか・・・・
データベース俺のまえにたちはだかってやがる・・・
ショップサイトも検索サイトもすべてCSVで処理してる俺は首すんぜんだろうか・・・

249 :nobodyさん:2005/06/15(水) 22:08:01 ID:???.net
>>247
・評価機能
・指定日時が過ぎると表示されない
・ポイントに応じて表示順位が変わる(ランキング?)

>>248
DBを使ったら恐ろしく多大なデータを処理出来るよ。
PHPとMySQLが軽くて最高だと思う。

ただし、レスポンスの問題で言えば、やはりサーバと回線の
問題によるから、それらの充実が一番だとは思う。

250 :nobodyさん:2006/11/11(土) 21:19:03 ID:???.net
              緊急浮上!
          ○_○   
         ( ・(ェ)・)   < 天然記念スレをまもれ!
         /つ¶つ ¶    
     / ̄ ̄ ̄ ̄ ̄ ̄ヽ  //
人人  /       ●   ●、  ザバァ!!
   /     〇        ▼ l 人人人
  /     =      , 、_ _人_ノヾ 
人人             ノ 人人
   人人人  人人        



251 :nobodyさん:2006/12/01(金) 22:51:13 ID:???.net
Googleの検索コマンドを使いこなせば、
このスレに出てるほとんどのアイディアが実現できる気がする。

252 :たま:2007/02/02(金) 10:45:34 ID:QBCmJWsF.net

検索エンジンのPHPスクリプトを配布しているところを探しています。
どなたかご存じでしょうか??
宜しくお願い致します。


253 :nobodyさん:2007/02/02(金) 11:27:23 ID:???.net
yomi php
で検索しろ

254 : ◆hb//x7qyug :2007/02/02(金) 12:12:18 ID:DuFcC87D.net
>>1
おもしろそう。協力しようか?

255 :nobodyさん:2007/02/03(土) 03:54:20 ID:???.net
おま・・いくらなんでも2001年の>>1にレスするのは・・・。

256 :nobodyさん:2007/02/07(水) 08:59:32 ID:CGn0u8gT.net
おまえらquery文字のパースってDBと連携してどうやってる?
googleライクに
"unko unko" -hogehoge (aaaa or "cc cc")
みたいなの

257 :nobodyさん:2007/02/08(木) 09:24:06 ID:???.net
実験でbisonで作ったパーサをモジュールの形でPHPに組み込んだことあるよ。
...めんどくさいけどね。でもPHPでパーサを書く場合でも.yの書き方は参考になる。

RubyならRacc


258 :nobodyさん:2007/02/13(火) 02:21:01 ID:???.net
ロボット検索自体を避けるように仕込んでなければ片っ端からサイトを拾ってくれるような
お行儀の悪い検索エンジンを使いたいです。

259 :nobodyさん:2007/02/20(火) 18:20:31 ID:???.net
ファイルを読み込んだ時にJavwScriptのコードを除外するいい方法はないですか?
フィルターとかあれば良いんですけど・・


260 :nobodyさん:2007/10/31(水) 21:21:23 ID:nkFoGGXY.net
259は新開発したか

261 :nobodyさん:2007/11/07(水) 06:37:03 ID:???.net
s/\<script.*\/script\>//gi;


262 :ギニア3世:2007/11/16(金) 21:23:24 ID:idEdN7T0.net
グーグルよりすごい?検索エンジン
http://www.quintura.com/

263 :nobodyさん:2008/06/08(日) 13:47:25 ID:oe9fgjbi.net
2003年から工藤智行氏が開発を続けている検索エンジン「FINDSPOT」
http://21news.cocolog-nifty.com/blog/2008/05/post_d828.html

連載:検索エンジンを作る|gihyo.jp … 技術評論社
http://gihyo.jp/dev/serial/01/make-findspot


264 :nobodyさん:2008/06/24(火) 02:01:34 ID:iHrl1LSI.net
>>5 バロスww

265 :nobodyさん:2008/06/27(金) 00:50:18 ID:gBJjjQVQ.net
携帯検索エンジン
携帯サイトおもちの方必見!
携帯で登録できるよ
http://search-k.net/jcom/

266 :nobodyさん:2008/12/07(日) 23:00:34 ID:WE1pXcYe.net
マーズフラグってなかなかいいかも
http://www.marsflag.com/

267 :nobodyさん:2008/12/20(土) 23:38:56 ID:WN7kdZGE.net
ttp://www.kokoni.com/

268 :nobodyさん:2008/12/22(月) 00:27:02 ID:9ZqbUAej.net
eltg33.no-ip.info
anonymouse:0123456789
Search script配布

269 :yamtoshi@hot .com:2008/12/31(水) 16:10:58 ID:???.net
検索結果にサムネを出すってアイデアも前スレにありましたが・・・

どうでしょう?

270 :nobodyさん:2008/12/31(水) 22:33:26 ID:MitumZi6.net
東京大学うぜーよ!!!!
てめーの研究室がクロールされろ!!!

crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp
crawl234.tkl.iis.u-tokyo.ac.jp

ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/
ttp://www.tkl.iis.u-tokyo.ac.jp/~crawler/

271 :nobodyさん:2008/12/31(水) 23:04:32 ID:???.net
池■田大■作の本名はソン・テチャク。小泉純一郎、小沢一朗は朝鮮人。
911では小型の水爆が使用されている。
http://ri■ch■ardkosh■im■izu.at.webry.info/
創価の保険金殺人事件。
オウム事件は、統一・創価.北朝鮮の共同犯行である。CIAが監修している。
http://www15.ocn.ne.jp/~oy■ako■don/kok_web■site/ir■iguc■hi.htm
与党も野党もメディアも全部朝鮮人だった。
http://jb■bs.li■vedo■or.jp/b■bs/read.cgi/news/20■92/115794■1306/

2ちゃんねるは統一■教会が個人情報を集めるための道具。運営には統一■教会がいる。
駅前で「手相を見せてください」と勧誘してるのが統一教■会。(カルト宗教)  
カルト宗教の下にいる人と上にいる奴を分けて考えないといけない。下にいる利用される人は上がどんなことをしてるか知らない。

ユダヤ権力の子分→2ちゃん運営=統一協会上層部=層化上層部=自民党清和会=野党の朝鮮人ハーフの政治家=
与党の朝鮮人ハーフの政治家=金 正日(キム・ジョンイル )=読売サンケイ=小沢十朗
ユダヤ人=ロックフェラー=ブッシュ=クリントン=ヒラリー=アドルフ・ヒトラー=オサマ・ビンラディン

毎日新聞スレを荒らしてる奴らも統■一教会の可能性が高い。
荒らしは洗脳するために「ネトウヨ」などのレッテル付けレスを何千回もする。
現実には「ネトウヨ」などは存在しない。
http://changi.2ch.net/test/read.cgi/ms/1230363385/

272 : 忍法帖【Lv=3,xxxP】 :2011/06/18(土) 02:06:04.51 ID:???.net
test

273 : 忍法帖【Lv=7,xxxP】 :2011/06/19(日) 12:32:30.89 ID:???.net
test

274 :名無しさん:2011/10/13(木) 00:52:05.66 ID:/EgVNFsq.net
取り越し苦労

275 :電脳プリオン 忍法帖【Lv=40,xxxPT】(3+0:8) 【14.6m】 :2013/02/02(土) 22:46:01.78 ID:???.net ?PLT(12080)
          | | ガガガッ
          | |
          人
  ∧_∧   <  >_∧∩
  ( ・∀・)   人`Д´)/ ←>>53
 と    )  <  >_∧∩
   Y /ノ    .人`Д´)/ ←>>59
    / )    <  >_∧∩
  _/し' //. V`Д´)/ ←>>231
 (_フ彡        /

276 :nobodyさん:2017/12/30(土) 15:50:54.61 ID:YhlYw6jg.net
誰でも簡単にネットで稼げる方法など
参考までに、
⇒ 『半藤のブブイウイウレレ』 というサイトで見ることができます。

グーグル検索⇒『半藤のブブイウイウレレ』

V50O6JDAJX

277 :nobodyさん:2019/11/04(月) 23:27:31.92 ID:hIibPdWp.net
プライバシー保護検索エンジン探しているならこれ見といた方がいい
https://chierou.com/internet/duckduckgo/

278 :nobodyさん:2022/02/25(金) 06:16:24.45 ID:W8SDnGbv.net
プーチンロシアはウクライナに何てことするんだよ

279 :ロシアによる北方領土進出企業への税優遇は「遺憾」:2022/03/10(木) 16:17:40.25 ID:ZzSzzF4L.net
松野博一官房長官は10日午前の会見で、ロシアが北方領土に進出する企業に対して税制の優遇措置を設けたことは「遺憾」であり、改めて日本の立場をロシア側に申し入れたと語った。

北方領土(北方四島、ロシア名クリル諸島)は、日本が領有権を主張し、ロシアが実効支配している。

ロシアの新制度では、北方領土を含む島の税制について、ロシア政府の登録を受けた企業に法人税や固定資産税など最大20年間の優遇措置を設けるなどとしている。松野長官は「北方4島に対する日本の立場や、首脳間の合意に基づき日ロ間で議論してきた北方4島における共同経済活動の主旨と相容れない」と述べた。

ウクライナのクレバ外相は9日、ロシア軍が占拠しているチェルノブイリ原子力発電所の電源が喪失したと明らかにした。これに関連し松野長官は「先に行われたザポロジエ原発への攻撃を含め、原子力施設に対するロシアの一連の行為を強く非難する」と語り、ロシアに対して同様の行為を即座に停止するよう強く求めた。

<穀物価格、情報の収集・分析進める>

農林水産省が9日発表した今年4月期の輸入小麦の政府売渡価格が昨年10月期から17%上昇し、2008年10月期以来の高水準となるなど、足元で穀物価格の上昇が国民生活に与える影響が懸念されている。

松野長官は、日本ではロシアとウクライナから穀物の輸入はほとんどないが、国際価格や貿易の動向に関する情報の収集・分析を進めると述べた。貿易などで影響を受ける可能性がある農林水産業や食品関連産業の事業者に向けた相談窓口を農水省に設置し、資金繰り支援などの情報発信を強化したという。

一方、アラブ首長国連邦(UAE)のアルオタイバ駐米大使は9日、UAEは原油増産を支持しているとし、石油輸出国機構(OPEC)に検討するよう働き掛けると述べた。松野長官はこの声明を「承知している」とし、次回のOPECプラス閣僚会合で国際原油市場の安定に向けた議論が行われることに期待を示した。10日開催予定の主要7カ国(G7)臨時エネルギー大臣会合においても、エネルギー市場の安定化に向け、各国と連携していきたいと語った。

280 :nobodyさん:2023/07/06(木) 10:20:53.55 ID:MEUZ7EmIA
軍事費GDρ比4%超でΝАТ0にまで加盟しようとしていたウクライナは周辺國に脅威視されて攻撃されたわけだか゛,
世界最惡の腐敗利権国家日本も軍事費倍増させて周辺国に脅威視されようとマッチポンプ戦争利権屋とヘ゛ッ夕リの岸田増税文雄か゛必死た゛な
ウクライナて゛市民への攻撃ガ─た゛の停電ガ一た゛の戰爭犯罪ガ一た゛の白々しいか゛.戦爭なんた゛から当たり前た゛ろ
曰本に絨毯爆撃して原爆まで落とした世界最悪のならず者國家なんて,いまだに新型戦略爆撃機とか發表してるだろ
軍事施設だけ爆撃とかあり得ないし.要するに戰略ってのは戰争となれは゛こいつを使って━般市民の家屋を焼き尽くすって意味た゛からな
國民を人間の盾にして,女こども以外逃亡(出國)禁止にして戰わせて.他國まて゛巻き込んでまで利権に執着してるキチガヰナセ゛レンスキ─を
いまだに引きす゛り降ろさないあたり、戦闘民族として現状を受け入れて,むしろリア儿サハ゛ケ゛―を楽しんて゛ると理解するのが正解
世界最悪の腐敗利権国家曰本は軍事費セ゛口にして,ポ─ラント゛のように国民に武器を持たせて扱い方を訓練する個人防衛國ヘと移行しよう!

創価学會員は.何百萬人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まて゛出てる世界最悪の殺人腐敗組織公明党を
池田センセーがロをきけて容認するとか本氣て゛思ってるとしたら侮辱にもほどがあるそ゛!
hΤТPs://i,imgur.сοm/hnli1ga.jpeg

281 :nobodyさん:2023/11/14(火) 14:39:57.52 ID:UZmCHgNXH
例えば、登録記号『JA323N』は「盗撮窃盜詐欺猥褻集団ダサヰ夕マ県警』なわけだが.
クソ航空機に生活や仕事を妨害されたら‥アプリ『ADS-B Unfiltered...』で登録記号を確認,証拠としてスクショも残しつつ
ttps://jasearch.info/
▲ここて゛検索して使用者を特定,ググって電話番號確認、この気候変動災害惹起私権侵害強盗殺人テ口リストにクレ━厶を入れよう!
最近のスマホのパケつ゛まりはクソ航空無線の広大なプラチナ帯域によるネット帯域不足が原因,國民の財産電波を独占して
殺人推進有害放送て゛儲けてるテレビを見ないのはもちろんプロパガンタ゛放送局か゛よく使う「一方的」『自称」「思い込んで」連発のNHKには
テ口資金供給してはならないし、今どき深夜に騷音まき散らさせて近隣に多大な被害を与えながら新聞配達させてる情弱知障を非難して
クソヘリ飛は゛す資金源を失わせてクソ航空関係200兆圓課税を主張しよう! ADS-B出してないのは大抵税金泥棒自閉隊か米軍な
(羽田)ttps://www.call4.jp/info.php?type=items&id=I0000062 , ttps://haneda-project.jimdofree.com/
(成田)ttps://n-souonhigaisosyoudan.amebaownd.com/
(テロ組織)ttps://i.imgur.com/hnli1ga.jpeg

88 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★