The Grumpy Biochemist

A blog by Felipe Riveroll Aguirre

Visualizando Resultados Para Blast en Mobyle@Pasteur

| Comments

Brevemente, BLAST (Basic Local Alignment Search Tool) es un método de búsqueda por homología, en el cuál se reta a la base de datos con una secuencia problema (query), para que encuentre secuencias relacionadas a nuestra secuencia problema.

Los resultados que BLAST arroja, son alineamientos pareados junto con los datos de la posición de la secuencia problema (query) con la secuencia que el programa encontró de la base de datos.

Uno de los problemas para hacer un alineamiento múltiple de las secuencias que encontramos en BLAST, es que los resultados solo arrojan links a las secuencias que nos interesan, de modo que hay que recuperar las secuencias una por una y además al hacer esto obtenemos la secuencia completa con residuos adicionales que no corresponden a la región que nos interesa (match) y por tanto obtenemos secuencias con una longitud distinta, lo cuál no es muy deseable para un alineamiento múltiple.

Así que si queremos visualizar los datos en forma de un alineamiento múltiple o generar archivos fasta con las secuencias alineadas, podemos utilizar MView el cual podemos descargar e instalar localmente en una maquina con linux, o también lo podemos utilizar en el portal Mobyle@pasteur.

Para hacer este análisis pueden seguirse los siguientes pasos:

  • Ir a Mobyle@pasteur.
  • En la pestaña program seleccionamos, database>homology>blast2
  • Ahora en la interfase web de blast2, seleccionamos como en la imagen: - Blast program: blastp
  • Proteín db: uniprot_sb
  • En la sección query sequence/query, para cargar la secuencia de ejemplo en la base de datos seleccionamos DB, después en la lista desplegable de abajo seleccionamos la base de datos uniprot y en el cuadro diálogo escribimos P25044 y damos click en Select.
  • Ahora el portal nos mostrará esta secuencia en el cuadro de diálogo más grande.
  • Ahora, vamos hacia la parte de arriba de la ventana y damos click en Run.
  • Y ahora el portal nos muestra los resultados.
  • Podemos ver que existen tres opciones para visualizar los resultados, como texto, html y de manera visual.
  • Seguido de donde están los resultados en texto, hay una lista desplegable seguida del botón further analysis.
  • Ahora seleccionamos de la lista mview(blast)>Further analysis.
  • Enseguida nos aparecerá la interfase web para mview con los resultados de blast, obtenidos anteriormente
  • Hay dos opciones que me parecen útiles para dar formato a los resultados de blast, por defecto está seleccionado html, lo que nos mostrará un alineamiento coloreado de la secuencias alineadas en blast. Pero si deseamos seguir trabajando con la secuencia, tenemos que obtener un archivo fasta, con todas las secuencias alineadas. Claro que también como podrán darse cuenta, hay muchas opciones, para poder filtrar las secuancias que queremos obtener, de momento solo vamos a usar otro programa para ver los resultados.
  • Seleccionamos Pearson/FASTA en el menú desplegable de la sección Output format (-out)
  • Y damos click en Run.
  • Ahora podemos ver como resultado un archivo con formato fasta de las secuencias.
  • De aqui, podemos seguir haciendo análisis filogenéticos u obtener estadísticas sobre el alineamiento, pero en este ejemplo, vamos a reformatear estos resultados con un programa de la suite EMBOSS, llamado showalign.
  • Similar a lo que hicimos para mandar los resultados de blast a mview, ahora vamos a seleccionar showalign(sequence).
  • Utilizando advanced options podemos seleccionar varias opciones para como queremos visualizar el alineamiento, como por ejemplo la scoring matrix y como queremos ver los residuos que no son idénticos
  • Por ejemplo podemos mostrar en los resultados los residuos similares y también ordenarlos de acuerdo a su similaridad con estas opciones
  • Para obtener el siguiente resultado:
  1. Neron, B., Menager, H., Maufrais, C., Joly, N., Maupetit, J., Letort, S., Carrere, S., Tuffery, P., & Letondal, C. (2009). Mobyle: a new full web bioinformatics framework. Bioinformatics, 25(22), 3005–3011. doi:10.1093/bioinformatics/btp493

Comments