Re: [Linux-programlama] 2 bitlik

---------

New Message Reply About this list Date view Thread view Subject view Author view Attachment view

From: Bora Güngören (bora@boragungoren.com)
Date: Mon 29 Aug 2005 - 14:21:43 EEST


Merhaba,

Elimizde 8 milyar bit lik alan olsun. Ben bunu 1 milyar char yada 4
milyar adet 2 bitlik bit alanı ile saklayabilirim. Ve "bellekte" tamamen
aynı şekilde organize olurlar. Yani aynı alanı kaplarlar :-)

Belleğe yüklenmesi, işlenmesi, bit karşılaştırma için yazılmış API'lerin
(char*) yani char dizisi işleyeceğini düşünürsek, "işlem hızı" tarafında
char kullanımı daha hızlı bile olabilir. Bunu daha detaylı açıklayan
mesajlar yazılmıştı.

"Veri madenciliği" amacı ile kurulacak olan algoritmalar (vaktiyle
yazmışlığım var) ağırlıklı olarak bellekte çalışacaktır ve sistemin
darboğazını oluşturacaktır. Bu nedenle veri tabanı yönetim sistemi
seçimi bile (duruma göre) önemsiz olabilir.

Bora Güngören.

serkan@cozum.com wrote:

>neden olmayak varchar beya char ile int veya integer veritabanında aynı
>fikziksel alanı mı kullanıyo demek istiyorsunuz yanı vc A il int 1 ayni
>alanı işgal eder mi demek istiyorsunuz ?
>
>>Merhaba,
>>
>>Bu uygulamada 2 bitlik değişken kullanarak yer kazanımı da olmayacaktır
>>ki. :-) Neyi tartışıyoruz? :-)
>>
>>Bora Güngören.
>>
>>Umut D. wrote:
>>
>>
>>>Bence burada "6" bit'in muhabbetini yapmayalim :P
>>>
>>>Şaka bir yana, bence gercekten %75 yer kazanciniz olacak, 8 bit yerine
>>>2 bit.
>>>Ancak o 2 bitlik veriyi analiz etmek icin gereken en basit
>>>matematiksel fonksiyonlari
>>>bile oturup 2 bite uyacak sekilde yazmaniz gerekecek. Ya da
>>>veritabanindan
>>>cektikten sonra yine char olarak kullanacaksiniz vs...
>>>
>>>Tamsayi ya da 8 bitlik veri dizeleri uzerinde calisan zaten pek cok
>>>istatistik vs
>>>kutuphanesi bulmaniz mumkun.
>>>
>>>Eski bir tabirle "Attiginiz tas urkuttugunuz kurbagaya degmez"
>>>
>>>Tabi data miktari buyudukce donanimda daha fazla disk ve ram
>>>gerekecek...
>>>
>>>Secim sizin...
>>>
>>>On 8/27/05, *serdar güler* <e141598@metu.edu.tr
>>><mailto:e141598@metu.edu.tr>> wrote:
>>>
>>> Herkese iyi günler,
>>>
>>> Biyoteknoloji ile ilgili bir tez çalışmam var, genome database
>>> şeklinde
>>> bir uygulama yazmak gibi bir düşüncemiz var.
>>>
>>> Genetiğe uzak olanlar için küçük bir için bilgi vereyim. DNA'yı
>>> oluşturan sadece 4 farklı çeşit baz var (adenin (A), timin(T),
>>> guanin(G)
>>> ve cytosine (C)).
>>>
>>> başka yazılmış databaseleri biraz inceledim, anladığım kadarıyla bu
>>> veriler -en azından benim gördüklerimde- karakter değişkenler olarak
>>> tanımlanmış ama aslen 2 bitlik değişkenler ile tanımlanıp bir
>>> hayli yer
>>> kazanımı olabilir gibi geldi. Bu mümkün müdür? tabii mesela insanın
>>> genomunda 10^7-10^8 arası baz olduğunu da eklersek ne kadar yer
>>> kazanımı
>>> olacağı konusunda bir fikir edinebilirsiniz sanırım.
>>>
>>> neyse programlama ile meslek olarak uğraşan insanlardan da tavsiye
>>> almak
>>> istedim sadece. Mesela ben şöyle bir şey yapmak istesem elimdeki
>>>1000
>>> bazlık bir DNA dizisinin elimdeki hedef 10^7 lik DNA dizisindeki
>>> herhangi bir bölge ile % kaç benzerlik içerdiğini ya da en fazla
>>>hangi
>>> bölgeyle benzerlik içerdiğini anlamak için fonksiyonlar yazsam bu 2
>>> bitlik tanımlama hikayesi benim hızımı ne kadar arttırır. Sonuç
>>>olarak
>>> uğraşmaya değer mi?
>>>
>>>
>>> _______________________________________________
>>> Linux-programlama mailing list
>>> Linux-programlama@liste.linux.org.tr
>>> <mailto:Linux-programlama@liste.linux.org.tr>
>>> http://liste.linux.org.tr/mailman/listinfo/linux-programlama
>>>
>>>
>>>
>>>
>>>------------------------------------------------------------------------
>>>
>>>_______________________________________________
>>>Linux-programlama mailing list
>>>Linux-programlama@liste.linux.org.tr
>>>http://liste.linux.org.tr/mailman/listinfo/linux-programlama
>>>
>>>
>>_______________________________________________
>>Linux-programlama mailing list
>>Linux-programlama@liste.linux.org.tr
>>http://liste.linux.org.tr/mailman/listinfo/linux-programlama
>>
>>
>
>
>_______________________________________________
>Linux-programlama mailing list
>Linux-programlama@liste.linux.org.tr
>http://liste.linux.org.tr/mailman/listinfo/linux-programlama
>
>
>
>

_______________________________________________
Linux-programlama mailing list
Linux-programlama@liste.linux.org.tr
http://liste.linux.org.tr/mailman/listinfo/linux-programlama


New Message Reply About this list Date view Thread view Subject view Author view Attachment view

---------

Bu arsiv hypermail 2.1.2 tarafindan uretilmistir.