[Linux] sorgulama

---------

New Message Reply About this list Date view Thread view Subject view Author view

From: Fuat Altun (faltun@iso.org.tr)
Date: Tue 06 Aug 2002 - 16:40:43 EEST


Merhabalar,
 
Web sitemiz için bir arama motoru hazırlamam gerekiyor. (jsp ile olacak)
Fakat web siteleri içindeki arama motorlarının çalışma prensiplerini
bilmiyorum.
 
Şöyle açıklıyım:
1-Sitemizde statik HTML sayfaları var.
2-Aynı zamanda dinamik olarak oluşturulan web sayfaları var. (jsp ve perl
ile)
3-Database'imiz Oracle.
4-Web server üzerinde word,excel,pdf, txt dökümanlar var.
 
Ben web sayfama koyacağım bir arama motoru ile bahsettiğim yapılar içinde
arama yapabilmek istiyorum. (gerekirse bunların içeriklerinin indekslenmesi
lazım herhalde)
Bunun için nasıl bir yol izlemem lazım?
Aklıma gelen bazı yöntemler var ama komik bir yol izlemek istemiyorum :-)))
Örneğin bahsettiğim tüm yapıları Oracle üzerinde'ki tabloloara koymak.
Böylece sadece tabloları sorgulayacağım. Yani statik HTML sayfalarını,
word,excel vb. Dosyalarını Oracle üzerindeki bir tabloda tutup sonra bunları
SQL ile sorgulayacağım. Fakat burada şöyle bir sorun var. Burada içerik
dışındaki meta yapılar da sorgunun içine girecek. Yani HTML içindeki Tagler
işin içine girecek.
Diğer bir yol ise bu yapılar file system üzerinde tutup sorgulamak. Fakat o
zamanda Oracle üzerindeki dinamik sayfaları ayrı sorgulamam lazım.
Word,excel,pdf'in indekslenip sorgulanmasını yapan ayrı toollar varmı?
 
Sonuç olarak bir çıkmazdayım. Bu konuda bana yardımcı olursanız sevinirim.
(İşletim sistemi Linux ve Solaris olacak)
 
 
Fuat
 
 

-----------------------------------------------------------------------
Liste üyeliğiniz ile ilgili her türlü işlem için
http://liste.linux.org.tr adresindeki web arayüzünü kullanabilirsiniz.

Listeden çıkmak için: 'linux-request@linux.org.tr' adresine,
"Konu" kısmında "unsubscribe" yazan bir e-posta gönderiniz.
-----------------------------------------------------------------------


New Message Reply About this list Date view Thread view Subject view Author view

---------

Bu arsiv hypermail 2b29 tarafindan uretilmistir.