Fingerprints 28 Noviembre 2007
Posted by formulacionmagistral in Concurso.trackback
Esta noche estoy motivado asi que aqui va otro post pendiente!!!!
He hablado mucho ultimamente de fingerprints. Que si fingerprints esto que si fingerprints aquello, que mira que guay soy que hablo en ingles…
Pero no he dicho ni una palabra de lo que son. Si, mea culpa. Bueno pues ahora toca que explique que leches es esto:
Primero, son una gran idea. Si, lo son. Muchas veces he pensado yo como se puede hacer lo que hacen de una manera rápida y nunca se me ha ocurrido algo parecido. De todas formas no es que yo sea una lumbrera….
Estos fingerprints (huellas dactilares) sirven para buscar moleculas parecidas entre miles de moleculas diferentes. Son unas cadenas de 0 y 1 (bits?), en las que cada una de las cifras representa una característica de la molécula. Ejemplo al canto, tengo una molécula como…no se, el ibuprofeno mismo, es lo que se llama un AINE (Antiinflamatorio no esteroideo) y mas concretamente un arilpropionico (Derivado del benceno con un sustituyente de 3 carbonos con grupo ácido), bueno, esto que he dicho en chino significa que tiene un grupo ácido (COOH), que es algo especial (vamos, no todas las moléculas lo tienen) así que si en mi fingerprint yo hubiera dicho la primera cifra significa presencia del grupo ácido carboxilico, entonces mi molecula tendria un 1, y las demas un 0. Ale, ya estan diferenciadas.
La idea es esa pero con muchas más cosas, de hecho, he puesto mi definición en la forja, pero es preliminar todavía.
Una vez que tienes el fingerprint de todas las moléculas que quieres comparar debes..no se…compararlas? Pues eso es lo más fácil y en lo que hay más soluciones todavía, la más común es el coeficiente de Tanimoto (si hombre, primo hermano de Miyagui) que es lo siguiente:
Suponemos tres moleculas:
Dificil, eh? A ver, que es eso de que se parece mas? en que sentido? depende de para que, no?
Para el investigador la más parecida es la que sea estructuralmente relacionada porque asume que puede tener actividad farmacológica parecida (mucho asumir…). Asi que, ¿cómo le dices a tu ordenador que compare tropecientasmil moléculas para que cuando subas de la cafeteria (si subes. ¡Como me gusta investigar!
te diga aqui tienes lo que te interesa? Pues con fingerprints por ejemplo.
Caso de antes, un fingerprint inventado que es:
0. Presencia de Oxígeno
1. Presencia de nitrógeno
2. Presencia de benceno
3. Presencia de enlace C=O
4. Presencia de enlaces C=C
Vale, pues los resultado serian los siguientes:
Molécula 1: 10111
Molécula 2: 11111
Molécula 3: 00101
Ahora hay que compararlos según Tanimoto el cálculo es:
a=Bits activados en ambos.
b=Bits activados en un compuesto
c=Bits activados en el otro compuesto
a/(c+b-a) —> Numero de 0 al 1 *100 -> Porcentaje de similaritud entre los compuesto. Voila!!
1vs1: 100% (ejem…)
1vs2: 80% (no esta mal)
1vs3: 50% (uhmm, muy bajo)
Ala que rollo!!!
Bueno pues para compensar metere otra fotica de por aquí (Mi pulgar aplastando el O2 Arena desde Canary Wharf)
Saludos desde Isle of the dogs!!!

supongo que se usa algún tipo de algoritmo potente para comprobar que dos moléculas se parecen…alguna q tenga q ver con grafos?
Es bastante habitual lo de los grafos lo que pasa es que esto es mas rapido para screening inicial de las moleculas esto de los fingerprints (si me puedo quitar moleculas demasiado complejas o simples, cuanto antes mejor). Luego, con los posibles candidatos ya reducidos, se usa algoritmos que sean algo mas lentos pero mas precisos.
Ademas los fingerprints los puedes precalcular a modo de hash (palabra correcta?) y luego compararlos con todas las moleculas que te apetezca en tiempo minimo.
Aunque esto es lo que he leido en los papers que son de hace un tiempo (5-6 años en esto es una barbaridad). Supongo que ahora mismo con todos los cores que tienen los micros se podrian usar tecnicas mas precisas aun a costa de un par de horas mas de proceso…..pero yo y el laboratorio solo tenemos unos P4 con sus 256Mb de RAM asi que….
Hey, gracias por tu interes, que tengo esto muy muerto!
si, en la universidad aprendemos esas estructuras de datos, tablas hash y demás teoría de grafos
comprendo lo q tienes q hacer con el problema, solo que no tengo una idea muy clara d lo q es “screening” o “fingerprints” :O
bueno,ya sabes como son los algoritmos,…de repente alguien se da cuenta q un código del año 80 ahora es cojonudo porque sus constantes ocultas se ajustan a la perfección con un modelo de cálculo computacional actual xD
Hombre…pasaba por aqui xD