The Grumpy Biochemist

A blog by Felipe Riveroll Aguirre

Western Blotting Parte II: Blotting

| Comments

La transferencia de proteínas o ácidos nucléicos a una membrana inmovilizante, es referida como “blotting”, la transferencia puede ser realizada por difusión molecular, por un flujo de buffer inducido por la succión (microfiltración) o acción capilar, el método utilizado de manera más frecuente es la electrotransferencia.

La difusión es un método simple pero muy ineficiente para aplicar a la mayoría de las transferencias, exepto para las transferencias de geles de agarosa. Generalmente las proteínas separadas en geles de poliacrlilamida se procesan por electroblotting, que utiliza la furza motriz de un campo eléctrico para que las proteínas eluyan desde el gel para inmovilizarlos en una matriz. Este método es rápido, eficiente y mantiene una alta resolución del patrón de bandas de las proteínas separadas por electroforesis.

Existen dos principales configuraciones para este método:

  • Transferencia húmeda: En la transferencia húmeda, el gel y la membrana se ponen en forma de sandwich entre la esponja y el papel (esponja/papel filtro/membrana/gel/papel filtro/esponja) y todo está sujeto firmemente, después de asegurarse que no existen burbujas de aire entre el gel y la membrana. El sandwich se sumerge en el buffer de transferencia al cuál se le aplica un campo eléctrico. Las proteínas cargadas negativamente viajan a través del electrodo cargado positivamente, pero la membrana las detiene, al unirlas previniendo que sigan avanzando.

Transferencia húmeda

  • Transferencia semi-seca: Para este tipo de transferencia, el gel y la membrana se colocan en forma de sandwich horizontalmente entre dos papeles filtro gruesos mojados con buffer (placa del ánodo/papel filtro/membrana/gel/papel filtro/placa del cátodo), los cuales están en contacto directo con dos placas sólidas de electrodos que están muy cerca una de la otra (la distancia entre ellas se limita solamente por el grosor del sandwich), también debe cuidarse en este método que no se generen burbujas entre el gel y la membrana, esto se hace después de colocar el segundo papel filtro haciendo rodar un pequeño tubo de ensaye por la superficie del filtro. El término semi-seca se refiere a la limitada cantidad de buffer.

Transferencia semi-seca

En la siguiente tabla podemos ver una comparación del buffer de transferencia para ambos métodos:

  Húmeda Semi-Seca
Tris base 25 mM 50 mM
Glicina 192 mM 40 mM
pH 8.2 N/D
SDS N/D 0.04 % (p/v)
Metanol 20 % 20 %

Como puede notarse la transferencia Semiseca utiliza menos glicina y permite una transferencia más rápida pero no es muy efectiva para proteínas mayores a 120 KDa.

En la siguiente tabla podemos ver una comparación entre ambos sistemas

  Transferencia Húmeda Transferencia Semi-seca
Flexibilidad Condiciones flexibles de voltaje, tiempo de blotting y requerimentos de enfriamiento del buffer; posiciones flexibles para los electrodos Dedicada a la transferencia rápida con un volúmen mínimo de buffer, sin necesidad de enfriamiento.
Resultados cuantitativos Vs. cualitativos Transferencia cuantitativa de proteínas de bajo peso molecular bajo condiciones que permitan la unión eficiente a la membrana. Algunas de las moléculas de bajo peso molecular pueden ser transferidas a través de la membrana sin unirse cuantitativamente.
Rango de peso molecular Amplio rango de peso molecular Eficiencia variable de transferencia para proteínas mayores a 120 KDa (puede ser mejorado con un sistema de buffer discontinuo); las proteínas de bajo peso molecular pueden ser transferidas a través de la membrana.
Tiempo de transferencia Tiempo extendido (hasta 24 hr) posible sin la depleción del buffer; pueden obenerse transferencias rápidas (15 a 60 min) bajo condiciones de alta intensidad. Transferencias rápidas; no puede haber transferencias extendidas debido a la depleción del buffer
Control de temperatura Regulación específica de la temperatura con un refrigerante y agua refrigerada a través de un recirculador; que permite transferencias a bajas temperaturas ( $4$ a $10^o C$ ). No es posible la regulación de la temperatura por enfriamiento externo.
Capacidad amortiguadora Hasta 10 a 12 L o tan bajo como 450 mL; la duración del tiempo para la transferencia no está restringida por una capacidad de buffer limitada. Mínimo 250 ml por experimento; se reduce el costo de los reactivos y el tiempo del experimento

Para la transferencia semi-seca, una concentración elevada de SDS, puede bloquear la unión de las proteínas a las membranas, pero el 0.01% facilita la transferencia, especialmente de proteínas grandes. La adición del 20% de metanol contraresta el hinchamiento del gel e incrementa la unión de proteínas obteniendo una buena resolución de bandas, además el metanol disminuye la posibilidad de que las proteínas se salgan del gel e incrementa su exposición a la membrana al incrementar la capacidad para que se peguen quitando el SDS de la superficie (esto beneficia a las proteínas más pequeñas) de la membrana, sin embargo, también impide la transferencia y deben ser balanceadas las concentraciones para esto. También deben ser equilibradas la corriente y el tiempo de transferencia dado que geles gruesos de poliacrilamida y moléculas hidrofóbicas y grandes (como los receptores) toman más tiempo de elución, mientras que, contrariamente las proteínas pequeñas transferidas a membranas para blotting con un tamaño grande del poro pueden pasar a través de la membrana si existe una saturación local para la unión de proteínas, causando su pérdida.

Además de lo mencionado anteriormente los siguientes factores determinan si una proteína se unirá durante la transferencia se enumeran a continuación.

  • Velocidad de elución desde el gel
    • Masa
    • Valores de corriente/voltaje
    • Propiedades fisicoquímicas de la proteína
      • hidrofobicidad
      • punto isoeléctrico
    • Modificaciones post-traduccionales, como por ejemplo el grado de glicosilación
    • Cantidad de SDS asociado a las proteínas: el SDS cubre a la proteína y le da una densidad de carga negativa
      • Gracias a esto la proteína se une rápidamente por la membrana
      • Limita la oportunidad para interactuar entre la membrana y las proteínas para su unión.
      • Permite que se solubilizen las proteínas y esto ayuda a las proteínas grandes como las proteínas de membrana.

Se utilizan dos tipos de membranas, las de nitrocelulosa, con tamaño de poro de 0.45 $\mu m$ y floruro de polivinilidieno ó PVDF (polyvinylidene difluoride), poseen un tamaño de poro de 0.45 y 0.22 $\mu m$ las cuales presentan solo pequeñas diferencias respecto a su capacidad de unión y la compatibilidad para el teñido. Su capacidad de unión a proteínas está al rededor de 100-200 $\frac{\mu g}{cm^{-2}}$.

Una vez que las proteínas se han transferido a la membarana, son más accesibles para varios ligandos que cuando estaban en el gel. En el blot ( la matriz inmovilizante que contiene las proteínas transferidas) se hace reaccionar con distintas sondas, tales como anticuerpos para la identificación del antígeno correspondiente. El blot generalmente requiere una cantidad pequeña de reactivos, las proteínas transferidas en las membranas pueden almacenarse por varias semanas después de su uso y también pueden ser utilizadas para análisis sucesivos.

  1. Biorad Protein Blotting Guide: A guide to transfer and detection. Retrieved from http://friveroll.github.io/pdfs/biorad-pbguide.pdf
  2. Kurien, Bt., & Scofield. (2015). Western Blotting: An Introduction. In B. T. Kurien & R. H. Scofield (Eds.), Western Blotting, Methods in Molecular Biology (Vol. 1312, 17–30). Springer New York. doi:10.1007/978-1-4939-2694-7_5
  3. Bjerrum, O. J., & Heegaard, N. Hh. (2001). Western Blotting: Immunoblotting. In eLS. John Wiley & SonsLtd. doi:10.1002/9780470015902.a0000995.pub2
  4. Towbin, H., Staehelin, T., & Gordon, J. (1979). Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proceedings of the National Academy of Sciences, 76(9), 4350-4354. Retrieved from http://www.pnas.org/content/76/9/4350.abstract
  5. Nieto García, S. La ciencia del Western Blott: Estrategias para mejorar los WB’s. Retrieved from http://friveroll.github.io/pdfs/WB.pdf

Western Blotting Parte I: Electroforesis

| Comments

El western blott o inmunoblott es un inmunoensayo en el cuál anticuerpos específicos son utilizados como sondas marcadas. Esta técnica permite comparar la abundancia de las proteínas separadas por electroforesis en gel, utilizando carriles distintos para cada una de las muestras.

La técnica puede dividirse en 5 pasos

  • Electroforesis
  • Blotting
  • Inmunodetección
  • Imagen
  • Análisis (Cuantificación)

Electroforesis

Cualquier molécula cargada en solución, migrará en un campo eléctrico aplicado, un fenómeno conocido como electroforesis. La velocidad de migración dependerá del campo eléctrico y de la densidad de carga de la molécula, esto es, la relación de masa/carga. Debido a que las proteínas disueltas tienen una carga neta, una solución que contiene una mezcla de proteínas, puede en teoría ser resuelta por una electroforesis, dado que las proteínas distintas con densidades de carga diferentes, migran hacia los electrodos apropiados a diferentes velocidades, sin embargo una separación efectiva nunca se alcanza dado que todas las proteínas están inicialmente distribuídas en la solución. La respuesta a este problema, es cargar la solución de proteínas en un amortiguador (buffer), permitiendo que las proteínas con densidades de carga distintas migren a zonas discretas.

La electroforesis puede ser de una sola dimensión (p.e un solo plano de separación) o de dos dimensiones, la separación bidimensional de proteínas puede ser utilizada para resolver todas las proteínas de una célula.

Si las proteías se separan en un gel de poliacrilamida el procedimiento es abreviado como SDS-PAGE (para Sodium Dodecyl Sulfate PolyAcrylamide Gel Electroforesis).

Los geles de poliacrilamida son formados por la polimerización de dos compuestos, la Acrilamida y la N-N-metilenbisacrilamida (o para abreviar Bis). Bis es un agente de anclaje cruzado (más cross linking) para los geles. La polimerización es inicada por la adición de persulfato de amonio junto con DMAP o TEMED. Los geles son redes tridimensionales, neutras e hidrofílicas de hidrocarburos largos entrecruzados por grupos metileno.

La separación de las moléculas dentro del gel es determinada por el tamaño de los poros formados en el gel. El tamaño del poro es determinado por dos factores: - La cantidad total de acrilamida presente designada como %T. - La proporción del agente de entrcruzamiento (cross linker). Conforme aumenta la cantidad de acrilamida presente, disminuye el temaño del poro. Los geles se determinan como soluciones en porcentaje y tienen dos parámetros necesarios. El total de acrilamida es dado como porcentaje (w/v) de acrilamida más la bis-acrilamida.

Regla de oro: Mientras más pequeña sea la proteína de interés, deberá ser mayor el porcentaje de mono/bis. Mientras más grande la proteína de interés, menor será el porcentaje mono/bis.

Tamaño de proteína (kDa) Porcentaje de Gel (%)
14 - 40 20
12 - 45 15
10 - 70 12.5
15 - 100 10
25 - 200 8

Nota: La acrilamida es una potente neurotoxina acumulativa: utilize guantes todo el tiempo. Coloque los geles en el tanque de electroforesis como lo indica el fabricante bañado en buffer.

  1. Abcam Definitive guide to western blot. Retrieved from http://friveroll.github.io/pdfs/wb-beginner.pdf
  2. Bjerrum, O. J., & Heegaard, N. Hh. (2001). Western Blotting: Immunoblotting. In eLS. John Wiley & SonsLtd. doi:10.1002/9780470015902.a0000995.pub2
  3. Hames, B. D. (1998). Gel electrophoresis of proteins: a practical approach. Practical approach series. Oxford University Press. Retrieved from https://books.google.com.mx/books?id=jtNqAAAAMAAJ
  4. Twyman, R. M. (2013). Principles of Proteomics. Taylor & Francis Group. Retrieved from https://books.google.com.mx/books?id=fTMmAgAAQBAJ

Modelos Animales De Estrés en Farmacología

| Comments

Los modelos animales, ofrecen la mejor aproximación, para entender los procesos de estrés en organismos biopsicosociales. En el laboratorio, se utilizan estresores psicológicos y físicos. Ejemplos de los últimos, son la restricción corporal y la exposición a un ambiente frío. Los procedimientos de estrés psicológico usualmente implican un proceso de aprendizaje, que requiere de más de una condición de tratamiento experimental, de manera que los componentes psicológicos, puedan ser extraídos puramente del estresor físico.

Algunos de los procedimientos utilizados más comúnmente en el laboratorio son los siguientes.

Estresores físicos: Restricción, frío, calor, nadar, ruido, prenatal, destete temprano, hacinamiento, inanición, movimiento, actividad forzada, manipulación, inducido por drogas e inducido por virus.

Estresores psicológicos: Predecibilidad y condicionamiento al miedo, control y afrontamiento, comunicación emocional, conflicto, agresión/defensa y novedad Para evaluar los efectos del estrés, producidos por estos procedimientos, se utilizan medidas dependientes, que representan los índices del estresor y consecuentemente definen la respuesta del estrés, para un estudio en particular, algunas de las más frecuentes se listan a continuación: Respuestas de comportamiento: comportamiento de beber y comer, actividad y respuestas aprendidas. Respuestas psicológicas: Cambios en el peso corporal, peso del timo y la glándula adrenal, ulceración gástrica, corticosterona plasmática, Dopamina, noradrenalina y producción de serotonina.

El procedimiento más utilizado experimentalmente, para la inducción de estrés utiliza la inmovilización del animal o restricción. Asimismo permite examinar de manera eficiente, síndromes reproducibles, tanto de disfunciones centrales como periféricas y enfermedades, así como también, la detección de cambios en las hormonas adrenocorticitrópicas, corticoesterona, proteína c-fos, desensibilización de la respuesta del eje HPA y la expresión de la citocinesis. Por otro lado es un procedimiento económico y raramente involucra daño al animal sometido, una vez que termina el periodo de estrés.

La restricción es indolora y carece de debilitamiento duradero. La inmovilización, una variante de la restricción restringe el grado de locomoción, pero no intenta limitar específicamente el movimiento de las extremidades, al igual que lo hacen la mayoría de las técnicas de restricción. Tanto la restricción como la inmovilización constituyen operaciones físicas, que son importantes como modelos de estrés psiquiátrico.

Los cambios psicológicos y fisiológicos asociados con la restricción, parecen resultar de la ansiedad y la naturaleza aversiva de permanecer inmovilizado, en lugar de la activación concurrente de mecanismos de dolor o causar un malestar irreversible.

Común a todos los métodos de restricción e inmovilización de movimiento incluye pero no está necesariamente limitada a lo siguiente: (a) el animal, es colocado en un cono rígido de plexiglás; (b) el animal es colocado en un decapicono (un tubo de plástico, cónico afilado); (c) las extremidades son pegadas con cinta o atadas a una tabla; (d) el animal es colocado en una malla de alambre que lo contiene; (e) un panel de plástico o de plexiglás es utilizado para restringir los movimientos motores en la esquina de una jaula; (f) el animal es colocado en una botella de plástico o una jaula de restricción; (g) el animal es envuelto en un alambre de gasa; (h) el animal es enrollado en una toalla, exponiendo solamente la cola y el hocico.

Los cambios fisiológicos observados más comúnmente incluyen, el incremento en los niveles de ACTH y corticoesterona, sin embargo esto involucra un decremento en la adquisición de la memoria y la retención, así como también cambios en la motivación. Para que pueda ser efectivo el procedimiento de restricción tienen que controlarse las siguientes variables: frecuencia, duración e intensidad del estresor. La frecuencia de un estresor (definido como el número de sesiones por día o semana) ha sido el punto central de muchos estudios con poca preocupación, del mínimo requerido para producir una respuesta a estrés. La severidad del método de restricción determina si el sujeto tiene la oportunidad de habituarse al estresor y disminuir la fuerza de la respuesta de estrés. La frecuencia afecta las variables del evento, así como también la progresión de distintos hallazgos. La aplicación de una sola sesión de estrés, parece ser más común, y es seguida al sacrificio del animal. Sin embargo un número limitado de estudios se preocupan por los efectos a largo plazo del estrés. Frecuentemente se utiliza un periodo de tres semanas de estrés diario de una sola sesión, y los hallazgos reportados generalmente tienden a llegar a la conclusión de que es mejor el período de estrés, en lugar de utilizar intervalos regulares.

La duración, refiere a la longitud de la exposición al estrés en cada sesión, el incremento de la duración no necesariamente implica un incremento de la experiencia de estrés. La intensidad es la magnitud de inmovilización o restricción al que el roedor es sujeto. La variación de la intensidad en los tipos de restricción empleada, puede sugerir un cambio en la experiencia del roedor al estrés psicológico. La restricción física causa a un animal a sentir incrementada la sensación de peligro, provocando la necesidad de escapar, o si esto es dibido a una restricción física, el animal es capaz de discriminar que está previniendo su movimiento y puede entonces intentar contrarrestarlo. Los investigadores han especulado que los animales que están restringidos físicamente, pueden adaptarse mejor, debido a que pueden aprender la causa de la restricción, distinto de aquellos que se les administra un fármaco que les impide moverse

  1. Buynitsky, T., & Mostofsky, D. I. (2009). Restraint stress in biobehavioral research: Recent developments. Neuroscience & Biobehavioral Reviews, 33(7), 1089–1098. doi:10.1016/j.neubiorev.2009.05.004
  2. Holsboer, F., & Ising, M. (2010). Stress Hormone Regulation: Biological Role and Translation into Therapy. Annual Review of Psychology, 61(1), 81–109. doi:10.1146/annurev.psych.093008.100321
  3. Paré, W. P., & Glavin, G. B. (1993). Chapter 16 - Animal models of stress in pharmacology . In F. van Haaren (Ed.), Methods in Behavioral Pharmacology, Techniques in the Behavioral and Neural Sciences (Vol. 10, 413 - 441). Elsevier. doi:http://dx.doi.org/10.1016/B978-0-444-81444-9.50021-3
  4. Radek, K. A. (2010). Antimicrobial anxiety: the impact of stress on antimicrobial immunity. Journal of Leukocyte Biology, 88(2), 263–277. doi:10.1189/jlb.1109740

Física Con Análisis De Video Utilizando Logger Pro

| Comments

La tecnología de análisis de video permite a los estudiantes hacer mediciones precisas de la posición de un objeto en el transcurso del tiempo durante su movimiento. Los Maestros de Física y docentes de todos los niveles, encontrarán que esta tecnología hace posible un análisis detallado de situaciones físicas que normalmente no sería posible analizar debido a las dificultades de medición, tiempo, costo y/o consideraciones de seguridad. Los Maestros de matemáticas también podrán descubrir que el análisis de video es un método económico y útil para estudiar ejemplos de fenómenos del mundo real que pueden ser descritos por gráficas y relaciones lineales, cuadráticas, hiperbólicas y sinusoidales.

El Análisis de Video consiste en utilizar una cámara de video para “registrar“ los datos de posición y tiempo, que pueden ser utilizados para modelar matemáticamente todo lo relacionado con la posición y/o el movimiento del objeto. Utilizando las características de avance cuadro por cuadro del video digital y marcando el cambio de posición de un objeto cuadro por cuadro, los estudiantes serán capaces de determinar de una manera precisa los detalles del movimiento estudiado. Una vez que se han obtenido los datos que consisten en el tiempo y posición del objeto de estudio, los estudiantes pueden determinar la velocidad y la aceleración del objeto, si la masa del objeto es conocida se pueden obtener valores tales como la energía cinética y potencial, fuerza, momento, etc. Y de esta forma obtener gráficas de los datos registrados y calculados.

La versión de prueba de Logger Pro puede ser descargada desde esta dirección http://www.vernier.com/downloads/logger-pro-demo/

para utilizar las características de análisis de video debe ser instalado quicktime http://support.apple.com/downloads/#quicktime

A continuación se presentan una serie de instrucciones para utilizar Logger Pro analizando videos de movimiento.

  1. Abrir Logger Pro.
  2. Insertar el Video Insertar > Video > Abra el folder donde se ubica la película > Seleccione el video que desea analizar.
  3. Dar click en el ícono en la esquina inferior derecha que tiene tres puntos rojos. Si usted ubica el puntero del ratón sobre él muestra la leyenda “Activar/Desactivar análisis video”
  4. Reorganizar la página para arreglar todos sus elementos. (Página > Auto organizar)
  5. Fijar la escala para el video. De click en el ícono que parece una regla Encuentre el objeto de referencia en el video para establecer la escala Ingrese la distancia en metros que corresponda con su objeto de referencia.
  6. Añadir los puntos que marcan la trayectoria del objeto. Seleccione el ícono de dice “Añadir Punto” Mueva el tiempo del video en el momento que usted desee grabar el movimiento. Utilizando las barras cruzadas (+) de click en una parte específica en el objeto. El video avanza automáticamente al siguiente cuadro para seguir trazando la trayectoria. Seleccione de nuevo el mismo punto en el objeto para registrar el cambio de posición.
  7. Establecer el origen de coordenadas de la gráfica. Click en el ícono que dice “Establecer Origen” Entonces de click en el punto de la película que usted quiere que represente el origen de la gráfica. En este punto usted debe ya de tener una gráfica con un eje horizontal para el tiempo (s) y un eje vertical para la distancia (m) con dos hileras de puntos. Un conjunto de puntos representa la posición horizontal del objeto (X(m)) vs. Tiempo(s)) El otro conjunto de puntos representa la posición vertical del objeto (Y(m)) vs. Tiempo(s)).
  8. Si existen previos debe de sincronizar los datos con el tiempo del video. En el video vaya al cuadro que represente el inicio del movimiento. De click en el botón de la esquina inferior derecha del video que dice “Sinc película a gráfica”. Cambie el conjunto de datos a 0 segundos. Verifique que esté seleccionada la casilla “Sincronizar colec. datos análisis video con colec. datos seleccionada” de click en OK
  9. Vincular la gráfica al video. Analizar > Examinar Esta es una de las mejores características de LoggerPro a medida que usted desplaza el ratón en la gráfica, el objeto en el video se mueve. Usted puede ver de manera simultánea la posición del objeto y sus coordenadas en la gráfica.
  10. Determinar la velocidad horizontal y/o vertical del objeto en el video. Analizar > Ajuste Lineal Si los puntos son lineales, la pendiente de la línea es la velocidad, o la rapidez. Si los puntos de Posición vs. tiempo se asemejan más a una curva que a una línea, usted puede determinar la aceleración del objeto.
  11. Copiar la página. Página > Añadir Página… (Seleccione “Copiar página actual”, click en OK)
  12. Encontrar la aceleración horizontal y/o vertical del objeto. Analizar > Ajuste Lineal La aceleración es la pendiente de la gráfica de velocidad, un objeto que no está acelerando tiene una pendiente cercana a cero.
  13. Otra manera de calcular la velocidad promedio horizontal y/o vertical de un objeto Analizar > Estadísticas Esto muestra el mínimo, máximo, promedio y mediana para el conjunto de datos.
  14. ¿Desea cambiar los valores negativos por positivos? Esto puede ser útil para el movimiento de caída libre dado que Logger Pro muestra la velocidad como negativa porque el objeto va hacia abajo. En la tabla de datos, dé doble click en el encabezado de la columna que desee cambiar de valores negativos a positivos En la caja de la ecuación, escriba “-“ antes de las palabras derivada (“X”, tiempo), para cambiar los valores de la velocidad.
  15. ¿Desea añadir un título para su gráfica? Dé click derecho en la gráfica, Entonces seleccione “Opciones gráfica…” Escriba el título que desea para su gráfica y de click en aplicar.
  16. Otra opción útil en “Opciones gráfica…” es la pestaña de “opciones eje”. En lugar de seleccionar “Autoescala” seleccione “Autoescala desde 0” o “Manual”
  17. Puede cambiar el color y la forma de los puntos de datos haciendo doble click en el encabezado de la columna de la tabla de datos, dando click en la pestaña de “Opciones” y seleccionado entonces el color y la forma/estilo que usted quiera.
  18. Usted puede añadir puntos para la trayectoria de un segundo y tercer objeto en el video y analizar también su movimiento. De click en el ícono “Establecer punto activo” en la barra que se ubica a la derecha de el video. Entonces regrese al paso 6 y repita conforme sea necesario desde ahi.
  19. Otros íconos en la barra ubicada a la derecha del video permiten esconder los puntos de trayectoria en el video, así como también la escala y el origen.
  20. Puede ver la vista preliminar de impresión utilizando el menú Archivo > Previsualización Impresión para ver como se vería impreso su documento.
  21. Vea si un ajuste de curva funciona mejor que un ajuste lineal en (Analizar > Ajuste de Curva).
  22. Intente sincronizar la gráfica con datos recolectados por un sensor Vernier (sensor de movimiento, etc.)
  23. Cree una nueva columna, ingrese la ecuación, y determine la posición del objeto en el futuro. (Datos > Nueva columna calculada)
  24. De click en (Analizar > Repetir) para observar el video y la generación los datos y su graficación simultáneamente
  25. De click en (Analizar > Interpolar) para determinar los valores y otras posiciones de la gráfica.

Existen más videos disponibles para el análisis, en esta dirección: http://livephoto.rit.edu/

El manual de análisis de Video para física se encuentra en la siguiente dirección electrónica: http://www.vernier.com/products/books/pva/

  1. Bryan, J. A. Video Analysis: Real World Investigations for Physics and Mathematics.
  2. Bryan, J. A. (2010). Investigating the conservation of mechanical energy using video analysis: four cases. Physics Education, 45(1), 50–57.
  3. Bryan, J. A. (2006). Technology for Physics Instruction. Contemporary Issues in Technology and Teacher Education. Contemporary Issues in Technology and Teacher Education, 6(2), 230–245.
  4. Bryan, J. A. (2005). Video analysis: Real-world explorations for secondary mathematics. Learning and Leading with Technology, 32(6), 22–24.
  5. Bryan, J. A. (2005). Physics instruction using video analysis technology.
  6. Bryan, J. A. (2005). Video analysis software and the investigation of the conservation of mechanical energy. Contemporary Issues in Technology and Teacher Education, 4(3), 248–298.

Utilizando R Para Analizar Datos De Cinética

| Comments

R es un lenguaje de programación estadístico y gráfico, que através del proyecto bioconductor puede ser usado para analisis bioinformáticos, en esta ocasión lo utilizaremos para graficar y analizar datos cinéticos.

El siguiente tutorial, está basado en el problema 1 del capítulo 4 del libro Biochemical Calculations de Irwin H Segel, y se mostrará como obtener $V_{max}$ y $Km$ a partir del análisis de los datos cinéticos por la gráfica de Lineweaver-Burk.

Primero generamos los vectores $S$ y $v$ para los datos del problema

1
2
3
4
S <- c(2.50e-06, 3.33e-06, 4.00e-06, 5.00e-06,
       1.00e-05, 2.00e-05, 4.00e-05, 1.00e-04,
       2.00e-03, 1.00e-02)
v <- c(24, 30, 34, 40, 60, 80, 96, 109, 119, 120)

Podemos visualizarlos en una tabla de la siguiente manera:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
data.frame(S, v) -> datos.cinetica
datos.cinetica

         S  v
1  2.50e-06  24
2  3.33e-06  30
3  4.00e-06  34
4  5.00e-06  40
5  1.00e-05  60
6  2.00e-05  80
7  4.00e-05  96
8  1.00e-04 109
9  2.00e-03 119
10 1.00e-02 120

Para poder obtener la grafica a partir de los datos anteriores

1
plot(datos.cinetica, main="V Vs. S", xmain="S", ymain="v")

Ahora necesitamos calcular los recíprocos $(r)$ para $S$ y $v$.

1
2
r.S <- 1/S
r.v <- 1/v

Graficando los recíprocos

1
plot(r.S, r.v, main="Lineweaver-Burk", xlab="1/[S]",  ylab="1/v", pch=20, col="blue")

Ahora necesitamos hacer la regresion lineal de estos datos y añadir la linea correspondiente a la regresión a nuestra gráfica

1
2
lm(r.v ~ r.S) -> lineweaver.reg
abline(lineweaver.reg, col="red")

Y la grafica final queda de la siguiente forma:

Cuando calculamos los datos para la regresión lineal, guardamos los resultados en la siguiente variable:

1
2
3
4
5
6
7
8
lineweaver.reg

Call:
lm(formula = r.v ~ r.S)

Coefficients:
(Intercept)          r.S
  8.343e-03    8.344e-08

Intercept, corresponde a la intersección en $Y$, que para este caso es $\frac{1}{V_{max}}$.

1
2
interseccion.y <- coef(lineweaver.reg)[1]
r.Vmax <- interseccion.y

Así que para calcular $V_{max}$

1
Vmax <- 1/r.Vmax

La pendiente está en r.S por lo tanto.

1
pendiente <- coef(lineweaver.reg)[2]

Para calcular la interseccion en $x$, necesitamos encontrar el valor de $x$ cuando $y = 0$, para la ecuación de la linea recta

1
interseccion.x <- -(interseccion.y/pendiente)

Y como la intersección en $x$ es $\frac{1}{km}$ en este modelo

1
r.km <- interseccion.x

Ahora podemos calcular $km$ de la siguiente forma

1
km <- -1/r.km

Ahora guardamos los datos de $Km$ y $V_{max}$ calculados previamente en un vector

1
Lineweaver.Burk <- c(Vmax=as.numeric(Vmax), Km=as.numeric(km))

Podemos comparar nuestros resultados, con los que se obtienen de la ecuación de Michaelis Menten, por medio de un ajuste no lineal

1
Mfit <- nls(v~(Vmax*S)/(Km+S), datos.cinetica, start=list(Vmax=1, Km=0))

Para poder comparar estos resultados los guardamos en un vector

1
Michaelis.Menten <- c(Vmax=as.numeric(coef(Mfit)[1]), Km=as.numeric(coef(Mfit)[2]))

Y utilizamos el comando rbind, para crear un data.frame con los resultados para los dos modelos

1
rbind(Lineweaver.Burk, Michaelis.Menten)

Ahora podemos comparar los resultados por ambos modelos

1
2
3
                 Vmax           Km
Lineweaver.Burk  119.8564 1.000130e-05
Michaelis.Menten 119.8967 9.997717e-06

Y finalmente si queremos graficar los datos obtenidos del modelo de Michaelis Menten podemos utilizar

1
plot(S, predict(Mfit), type="l", main="V Vs. S", xlab="S", ylab="v")

  1. Segel, I. H. (1976). Enzymes. In Biochemical Calculations: How to Solve Mathematical Problems in General Biochemistry (2 ed., 208–319). John Wiley and Sons. Retrieved from http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/0471774219

Código completo

Introducción Al Análisis De Microarreglos

| Comments

Los datos que utilizaremos vienen de un estudio de Chiaretti et al. sobre la leucemia linfoblastica aguda (ALL), la cual fue conducida con chips de microarreglos HG-U95Av2 de Aymetrix. El paquete de datos ALL contiene los datos de expresion del experimento, normalizados con rma (las intensidades estan en escala log2), junto con las anotaciones de las muestras.

Para ello utilizaremos R /Bioconductor Si no has instalado Bioconductor previemente necesitas correr las siguientes líneas

1
2
source("http://bioconductor.org/biocLite.R")
biocLite()

Necesitaremos instalar algunas librerías de Bioconductor

1
biocLite(c("affy","ALL","annotate","hgu95av2.db","multtest","topGO","genefilter"))

Ahora, cargamos los datos de microarreglos y los asociamos a un set de expresión con

1
2
library(ALL)
data(ALL)

Y para conocer la dimensión de la matriz de expresión

1
dim(exprs(ALL))

[1] 12625 128

Por tanto, se trata de 128 columnas (muestras) con 12,625 filas (sondas) Nos interesa seleccionar todas las sondas de las células B (que pueden ser identicadas por la columna BT del ExpressionSet ALL).

1
table(ALL$BT)
1
2
B B1 B2 B3 B4  T T1 T2 T3 T4
5 19 36 23 12  5  1 15 10  2

Ademas nos interesa la comparacion de las sondas con la fusión del gen BCR/ABL resultante de la traslocacion de los cromosomas 9 y 22

1
table(ALL$mol.biol)
1
2
ALL1/AF4  BCR/ABL E2A/PBX1      NEG   NUP-98  p15/p16
      10       37        5       74        1        1

Para seleccionar todos los genes de las células B con la fusión BCR/ABL y del grupo control

1
2
3
subset <- intersect(grep("^B", as.character(ALL$BT)),
                    which(as.character(ALL$mol.biol)
                          %in% c("BCR/ABL", "NEG")))

Y creamos un nuevo set de expresión con los genes seleccionados previamente

1
eset <- ALL[, subset]

Para poder comparar el grupo de los pacientes control con los que presentan la fusión BCR/ABL, necesitamos convertir a factores la columna eset$mol.biol

1
2
eset$mol.biol <- factor(eset$mol.biol)
table(eset$mol.biol)
1
2
BCR/ABL     NEG
     37      42

Muchos de los genes en el chip no se expresan en las celulas B estudiados aquí, o podrían solo tener una pequeña variabilidad a traves de las sondas. Trataremos de remover esos genes con un filtro de intensidad (la intensidad de un gen debe de estar arriba de 100 y en al menos el 25 porciento de las sondas); y un filtro de varianza (el rango intercuartil de las intensidades log2 debera ser al menos de 0.5)

1
2
3
4
library(genefilter)
f1 <- pOverA(0.25, log2(100))
f2 <- function(x) (IQR(x) > 0.5)
ff <- filterfun(f1, f2)

Cuantos genes podemos obtener despues del filtrado?

1
2
selected <- genefilter(eset, ff)
sum(selected)

[1] 2391

Crearemos un nuevo ExpressionSet que contenga solo los genes que pasaron nuestro filtro.

1
esetSub <- eset[selected, ]

Ahora estamos listos para analizar la expresion diferencial en los genes seleccionados entre las muetraas BRC/ABL y la normales citogenéticamente. Utilizaremos una prueba t pareada, para identicar los genes expresados de manera diferencial entre los dos grupos.

1
library(multtest)

La funcion mt.teststat del paquete multtest nos permite calcular varios estadsticos de prueba comunmente usados para todas las las de una matriz de datos (chequen su pagina de ayuda). Primero, calcularemos los p-values nominales

1
2
3
4
5
6
library(multtest)
cl <- as.numeric(esetSub$mol.biol == "BCR/ABL")
t <- mt.teststat(
exprs(esetSub),
classlabel = cl,
test = "t.equalvar")

La funcion pt nos da la distribucion t.

1
pt <- 2 * pt(-abs(t), df = ncol(exprs(esetSub)))

Podemos obtener una impresion de la cantidad de genes expresados de manera diferencial, observando en un histograma de la distribucion del valor de p.

1
hist(pt, 50)

La función mt.rawp2adjp de el paquete multtest contiene distintos procedimeintos de prueba (Checa la página de ayuda para esta función). Para obtener el ajuste de p-value en términos de FDR (False Discovery Rate) utilizaremos el método de Benjamini y Hochberg. ¿Cuántos genes obtendremos si imponemos un FDR de 0.1?

1
2
pAdjusted <- mt.rawp2adjp(pt, proc = c("BH"))
sum(pAdjusted$adjp[, "BH"] < 0.1)

[1] 171

También esta función retorna los p-values ordenados de menor a mayor. Para obtenerlos ordenados utilizaremos:

1
2
pBH <- pAdjusted$adjp[order(pAdjusted$index), "BH"]
names(pBH)<-featureNames(esetSub)

Ahora, queremos conocer cuáles genes son los más significativos, por medio de el análisis de sus valores crudos (raw) y sus p-values ajustados por distintos métodos. Los símbolos de los genes son obtenidos por medio del paquete de anotación hgu95av2.

1
2
3
4
5
library(annotate)
library(hgu95av2.db)
diff <- pAdjusted$index[1:10]
genesymbolsDiff <- unlist(mget(featureNames(esetSub)[diff], hgu95av2SYMBOL))
genesymbolsDiff
1
2
3
4
 1636_g_at   39730_at    1635_at   40202_at   37027_at 39837_s_at
    "ABL1"     "ABL1"     "ABL1"     "KLF9"    "AHNAK"   "ZNF467"
40480_s_at   33774_at   36591_at   37014_at
     "FYN"    "CASP8"   "TUBA4A"      "MX1"

El top 3 de las sondas representan al gen ABL1, el cual es afectado, por la traslocación caracterizada por mas sondas BCR/ABL. Ahora queremos ver si existen otro conjunto de sondas que representen a este gen, y ver éste ha sido seleccionado por nuestro filtro no específico.

1
2
3
geneSymbols = unlist(mget(featureNames(ALL), hgu95av2SYMBOL))
ABL1probes <- which(geneSymbols == "ABL1")
selected[ABL1probes]
1
2
  1635_at 1636_g_at 1656_s_at 2040_s_at 2041_i_at  39730_at
     TRUE      TRUE     FALSE     FALSE     FALSE      TRUE

Así que los otros conjuntos de sondas en el chip representando ABL1 han sido eliminados por el filtro, debido a baja intensidad o baja varianza. Ahora queremos saber si esto indica también expresión diferencial del gen ALB1.

1
2
3
4
tABL1 <- mt.teststat(exprs(eset)[ABL1probes, ], classlabel = cl,
test = "t.equalvar")
ptABL1 <- 2 * pt(-abs(tABL1), df = ncol(exprs(esetSub)) - 2)
sort(ptABL1)
1
2
[1] 3.762489e-14 4.791997e-13 2.445693e-10 5.486259e-02 5.842693e-01
[6] 7.570959e-01

Vemos ahora que solo tres de las seis sondas para ABL1 muestran evidencia (de hecho, evidencia muy fuerte) para expresión diferencial. Seria interesante seguir investigando si el conjunto de sondas, en lo que concierne pe. a su localización en la secuencia del transcripto ABL1 - en efecto la fusión de genes BCR/ABL resulta de la traslocación del gen normal ABL1. Utilizando la ontología de genes Muchos de los efectos debidos a la traslocación BCR/ABL, son mediados por la actividad de tirosina cinasa. Veamos ahora los conjuntos de sondas en el chip que pertenecen a el término GO de actividad proteína tirosina cinasa, la cuál tiene el identificador GO:0004713.

1
2
3
4
5
gN <- featureNames(esetSub)
tykin <- unique(unlist(lookUp("GO:0004713",
"hgu95av2", "GO2ALLPROBES")))
str(tykin)
sel <- (gN %in% tykin)

Ahora podermos checar si los genes entre las tirisina cinasas son expresados de manera diferencial, respecto a los otros genes. Utilizaremos una prueba exacta de Fisher, para tablas de contingencias, para revisar las proporciones de los genes expresados diferencialmente son significativas entre dos grupos de genes.

1
2
tab <- table(pt < 0.05, sel, dnn = c("p < 0.05", "tykin"))
print(tab)
1
2
3
4
    tykin
p < 0.05 FALSE TRUE
   FALSE  1914   26
   TRUE    434   17
1
fisher.test(tab)
1
2
3
4
5
6
7
8
9
10
Fisher's Exact Test for Count Data

data:  tab
p-value = 0.001297
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 1.453631 5.573555
sample estimates:
odds ratio
  2.881814

Análisis para el enriquecimiento de conjunto de genes. Ahora queremos buscar el enriquecimiento en la expresión diferencial en todas las categorías GO, no solo para la actividad de tirosina cinasa. Utilizaremos el paquete TopGO para este fin. Y necesitaremos definir una función que seleccione los genes expresados de manera diferencial.

1
2
library(topGO) #load the package
topDiffGenes <- function(allScore) return(allScore < 0.05)

Ahora estamos listos para hecer un nuevo objeto topGO. Buscaremos en las ontologías en el nivel de función molecular MF.

1
2
3
GOdataMF <- new("topGOdata", ontology = "MF",
allGenes = pBH, geneSel = topDiffGenes, annot = annFUN.db,
affyLib = "hgu95av2.db")

Ahora podremos correr una prueba de fisher, para todos los procesos biológicos o utilizar algunos otros métodos (Bioinformatics, 2006, 22(13):1600-1607)

1
2
3
4
resultFisher <- runTest(GOdataMF, algorithm = "classic", statistic = "fisher")
resultKS<- runTest(GOdataMF, algorithm = "classic", statistic = "ks")
resultFisher.elim<- runTest(GOdataMF, algorithm = "elim", statistic = "fisher")
resultKS.elim<- runTest(GOdataMF, algorithm = "elim", statistic = "ks")

Para mostrar los resultados

1
2
3
4
allRes <- GenTable(GOdataMF, classicFisher = resultFisher,
classicKS = resultKS,elimFisher = resultFisher.elim, elimKS = resultKS.elim,
orderBy = "elimKS", ranksOf = "classicFisher", topNodes = 20)
allRes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
    GO.ID                                        Term Annotated
1  GO:0005509                         calcium ion binding        78
2  GO:0004714 transmembrane receptor protein tyrosine ...         7
3  GO:0003785                       actin monomer binding         3
4  GO:0004515 nicotinate-nucleotide adenylyltransferas...         3
5  GO:0051019    mitogen-activated protein kinase binding        10
6  GO:0004871                  signal transducer activity       188
7  GO:0042379                  chemokine receptor binding        10
8  GO:0038023                 signaling receptor activity        91
9  GO:0005516                          calmodulin binding        25
10 GO:0008201                             heparin binding        16
11 GO:0005088 Ras guanyl-nucleotide exchange factor ac...        26
12 GO:0015276           ligand-gated ion channel activity         9
13 GO:0005520          insulin-like growth factor binding         4
14 GO:0031730             CCR5 chemokine receptor binding         8
15 GO:0048020              CCR chemokine receptor binding         8
16 GO:0044325                         ion channel binding        27
17 GO:0030515                              snoRNA binding         4
18 GO:0003735          structural constituent of ribosome        25
19 GO:0050699                           WW domain binding         5
20 GO:0017112 Rab guanyl-nucleotide exchange factor ac...         6
   Significant Expected Rank in classicFisher classicFisher classicKS
1            9     3.57                    20       0.00802   0.00017
2            1     0.32                   191       0.27977   0.00028
3            3     0.14                     3       9.3e-05   0.00250
4            3     0.14                     4       9.3e-05   0.00250
5            3     0.46                    21       0.00882   0.00354
6           12     8.60                   147       0.14534   4.2e-06
7            1     0.46                   235       0.37447   0.00364
8            9     4.16                    38       0.02102   0.00050
9            1     1.14                   320       0.69179   0.00747
10           1     0.73                   279       0.52843   0.00801
11           5     1.19                    15       0.00554   0.00919
12           0     0.41                   388       1.00000   0.00925
13           1     0.18                   152       0.17089   0.00944
14           1     0.37                   204       0.31282   0.01124
15           1     0.37                   205       0.31282   0.01124
16           7     1.23                     6       0.00014   0.01204
17           0     0.18                   389       1.00000   0.01243
18           0     1.14                   390       1.00000   0.01295
19           0     0.23                   391       1.00000   0.01346
20           2     0.27                    47       0.02755   0.01445
   elimFisher  elimKS
1     0.00802 0.00017
2     0.27977 0.00028
3     9.3e-05 0.00250
4     9.3e-05 0.00250
5     0.00882 0.00354
6     0.52856 0.00360
7     0.37447 0.00364
8     0.27691 0.00717
9     0.69179 0.00747
10    0.52843 0.00801
11    0.00554 0.00919
12    1.00000 0.00925
13    0.17089 0.00944
14    0.31282 0.01124
15    0.31282 0.01124
16    0.00014 0.01204
17    1.00000 0.01243
18    1.00000 0.01295
19    1.00000 0.01346
20    0.02755 0.01445

Por último queremos buscar genes en una de las categorías GO. La función printGenes, está hecha para esa tarea. Hagámoslo para la actividad proteína tirosina cinasa (GO:0004713) como un ejemplo.

1
2
3
4
gt <- printGenes(GOdataMF,
whichTerms = "GO:0004713", chip = "hgu95av2.db",
numChar = 40)
gt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
          Chip ID LL.id Symbol.id
1636_g_at   1636_g_at    25      ABL1
39730_at     39730_at    25      ABL1
1635_at       1635_at    25      ABL1
40480_s_at 40480_s_at  2534       FYN
2039_s_at   2039_s_at  2534       FYN
754_s_at     754_s_at   613       BCR
36643_at     36643_at    NA      <NA>
38662_at     38662_at  5610   EIF2AK2
34877_at     34877_at  3716      JAK1
537_f_at     537_f_at   613       BCR
2057_g_at   2057_g_at  2260     FGFR1
1007_s_at   1007_s_at    NA      <NA>
760_at         760_at  8445     DYRK2
1333_f_at   1333_f_at   613       BCR
2056_at       2056_at  2260     FGFR1
854_at         854_at   640       BLK
41594_at     41594_at  3716      JAK1
1065_at       1065_at  2322      FLT3
34583_at     34583_at  2322      FLT3
33804_at     33804_at  2185     PTK2B
40742_at     40742_at  3055       HCK
1498_at       1498_at  7535     ZAP70
40936_at     40936_at 51232     CRIM1
36264_at     36264_at  4145      MATK
1844_s_at   1844_s_at  5604    MAP2K1
1810_s_at   1810_s_at  5580     PRKCD
36909_at     36909_at  7465      WEE1
993_at         993_at  7297      TYK2
39931_at     39931_at  8444     DYRK3
36115_at     36115_at  1198      CLK3
2059_s_at   2059_s_at  3932       LCK
2075_s_at   2075_s_at    NA      <NA>
33238_at     33238_at  3932       LCK
292_s_at     292_s_at  1195      CLK1
32833_at     32833_at  1195      CLK1
1622_at       1622_at  5606    MAP2K3
1768_s_at   1768_s_at  1445       CSK
38118_at     38118_at  6464      SHC1
1008_f_at   1008_f_at  5610   EIF2AK2
1512_at       1512_at  1859    DYRK1A
36946_at     36946_at  1859    DYRK1A
1630_s_at   1630_s_at  6850       SYK
1130_at       1130_at  5604    MAP2K1
1402_at       1402_at  4067       LYN
32616_at     32616_at  4067       LYN
36885_at     36885_at  6850       SYK
                                         Gene name raw p-value
1636_g_at  c-abl oncogene 1, non-receptor tyrosine ...    9.00e-11
39730_at   c-abl oncogene 1, non-receptor tyrosine ...    5.73e-10
1635_at    c-abl oncogene 1, non-receptor tyrosine ...    1.95e-07
40480_s_at       FYN oncogene related to SRC, FGR, YES    0.000341
2039_s_at        FYN oncogene related to SRC, FGR, YES    0.002151
754_s_at                     breakpoint cluster region    0.027205
36643_at                                            NA    0.028651
38662_at   eukaryotic translation initiation factor...    0.036347
34877_at                                Janus kinase 1    0.048349
537_f_at                     breakpoint cluster region    0.065386
2057_g_at          fibroblast growth factor receptor 1    0.065447
1007_s_at                                           NA    0.080622
760_at     dual-specificity tyrosine-(Y)-phosphoryl...    0.084581
1333_f_at                    breakpoint cluster region    0.116256
2056_at            fibroblast growth factor receptor 1    0.136657
854_at                      B lymphoid tyrosine kinase    0.142854
41594_at                                Janus kinase 1    0.158560
1065_at                  fms-related tyrosine kinase 3    0.224691
34583_at                 fms-related tyrosine kinase 3    0.225452
33804_at                protein tyrosine kinase 2 beta    0.288513
40742_at                       hemopoietic cell kinase    0.328005
1498_at    zeta-chain (TCR) associated protein kina...    0.339735
40936_at   cysteine rich transmembrane BMP regulato...    0.340416
36264_at      megakaryocyte-associated tyrosine kinase    0.439155
1844_s_at  mitogen-activated protein kinase kinase ...    0.486525
1810_s_at                      protein kinase C, delta    0.502015
36909_at                     WEE1 G2 checkpoint kinase    0.577787
993_at                               tyrosine kinase 2    0.577787
39931_at   dual-specificity tyrosine-(Y)-phosphoryl...    0.659157
36115_at                             CDC-like kinase 3    0.710543
2059_s_at  lymphocyte-specific protein tyrosine kin...    0.727480
2075_s_at                                           NA    0.754511
33238_at   lymphocyte-specific protein tyrosine kin...    0.768520
292_s_at                             CDC-like kinase 1    0.786830
32833_at                             CDC-like kinase 1    0.799613
1622_at    mitogen-activated protein kinase kinase ...    0.807841
1768_s_at                        c-src tyrosine kinase    0.888941
38118_at   SHC (Src homology 2 domain containing) t...    0.896863
1008_f_at  eukaryotic translation initiation factor...    0.909363
1512_at    dual-specificity tyrosine-(Y)-phosphoryl...    0.918548
36946_at   dual-specificity tyrosine-(Y)-phosphoryl...    0.924559
1630_s_at                       spleen tyrosine kinase    0.929048
1130_at    mitogen-activated protein kinase kinase ...    0.932251
1402_at    v-yes-1 Yamaguchi sarcoma viral related ...    0.969757
32616_at   v-yes-1 Yamaguchi sarcoma viral related ...    0.981146
36885_at                        spleen tyrosine kinase    0.999958

Este ejercicio está basado y adaptado en una práctica de Stale Nygard de Bioinformatics core facility, OUS/UiO.

  1. Chiaretti, S. (2005). Gene Expression Profiles of B-lineage Adult Acute Lymphocytic Leukemia Reveal Genetic Patterns that Identify Lineage Derivation and Distinct Mechanisms of Transformation. Clinical Cancer Research, 11(20), 7209–7219. doi:10.1158/1078-0432.ccr-04-2165
  2. Nygraard, S. (2011). Microarray data lab. Retrieved from http://friveroll.github.io/pdfs/R-lab-sn.pdf

Código Completo:

Comparación Estructural De Proteínas

| Comments

Las proteinas se componen de un juego de 20 aminoácidos distintos, unidos en cualquier orden lineal. La secuencia de aminoácidos se denomina, secuencia primaria, ésta última, forma estructuras secundarias a través de interacciones intermoleculares, que a su vez forman estructuras terciarias.

La estructura tridimensional de las proteínas, en la mayoría de los casos, da luz a los mecanismos catalíticos e interacciones potenciales entre otras moléculas, ambos aspectos ayudan a inferir la función molecular de una proteína.

Cuando se necesita hacer una comparación entre proteínas, se recurre en bioinformática a un alineamiento, ya sea por pares o múltiple, sin embargo a este nivel solo podemos obtener información a nivel de residuos aminoacídicos, lo cual puede darnos una idea de la similaridad entre las secuencias de las proteínas analizadas, si estas últimas son conservadas, resultarán estructuras similares. Sin embargo, la estructura de las proteínas, es más conservada que las secuencias durante la evolución, lo cual facilita que se conserve la función biológica de las proteínas. Esto es muy útil para establecer relaciones evolutivas distantes, no detectables por métodos basados en secuencias.

La comparación de estructuras puede servirnos para:

  • El análisis de cambios conformacionales, respecto a la unión de ligando.
  • La detección de relaciones evolutivas distantes.
  • El análisis de la relación estructural en las familias de proteínas.
  • La identificación de motivos estructurales comunes.

A continuación se listan algunos de los recursos en internet para la comparación de estructuras, de proteínas.

  1. Eidhammer, I., Jonassen, I., & Taylor, W. R. (2004). Protein Bioinformatics: An Algorithmic Approach to Sequence and Structure Analysis (1 ed.). Wiley. Retrieved from http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/0470848391
  2. Meng, E. C. (2005, April). Online Structure Alignment Resources. Retrieved from http://www.cgl.ucsf.edu/home/meng/grpmt/structalign.html
  3. Structural alignment Structural alignment. Retrieved from http://en.wikipedia.org/wiki/Structural_alignment

Búsqueda De Motivos en Proteínas

| Comments

Para descubrir las funciones de una proteína, que no corresponde a ninguna de las secuencias en las bases de datos. Lo cual ocurre frecuentemente, para las proteínas predichas de un genoma recién completado, que no tiene homólogos identificables.

Aún si no se conocen homólogos, una proteína puede tener características tales como, dominios transmembranales, sitios potenciales de fosforilación o estructura secundaria predicha. Estos rasgos dan pistas de la estructura y/o función de una proteína.

Para proteínas que tienen ortólogos y/o parálogos, existen regiones de identidad significativa en aminoácidos, que comparten características estructurales sustanciales y/o identidad de secuencias, lo cual tiene una variedad de nombres como: firmas, dominios, módulos, elementos modulares, motivos, patrones o repetidos.

En esta ocasión, dedicaremos esta sección a los motivos:

Podemos definir un motivo como un patrón conservado de aminoácidos, que puede ser encontrado en una o más proteínas, que pertenecen a un grupo de proteínas con actividad bioquímica similar, los cuales frecuentemente estan cerca del sitio activo de una proteína.

Algunas de las herramientas en línea para buscar motivos en proteínas son las siguientes:

  • MnM 2.0 Minimotif miner, analiza la presencia de motivos funcionales, involucrados en las modificaciones posttraduccionales, unión a otras proteínas, ácidos nucléicos o pequeñas moléculas o tráfico de proteínas.

  • Motif Scan Busca todos los motivos conocidos en una secuencia.

  • NetPhosK 1.0 Server Predice sitios de fosforilación por cinasas de eucariotes por medio de redes neuronales, de las siguientes cinasas: PKA, PKC, PKG, CKII, Cdc2, CaM-II, ATM, DNA PK, Cdk5, p38 MAPK, GSK3, CKI, PKB, RSK, INSR, EGFR and Src.

  • NetPhos 2.0 Server Predice por redes neuronales, sitios de fosforilación en serina, treonina y tirosina para proteínas de eucariotes.

  1. Balla, S., Thapar, V., Verma, S., Luong, Tb., Faghri, T., Huang, C.-H., Rajasekaran, S., del Campo, J. J., Shinn, J. H., Mohler, W. A., & et al. (2006). Minimotif Miner: a tool for investigating protein function. Nature Methods, 3(3), 175–177. doi:10.1038/nmeth856
  2. Mount, D. (2013). Bioinformatics: Sequence and Genome Analysis (2 ed.). Cold Spring Harbor Laboratory Press. Retrieved from http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/0879697121
  3. Pevsner, J. (2013). Bioinformatics and Functional Genomics (2 ed.). Cold Spring Harbor Laboratory Press. Retrieved from http://www.amazon.com/exec/obidos/redirect?tag=citeulike07-20&path=ASIN/B004KPVA46

Visualizando Resultados Para Blast en Mobyle@Pasteur

| Comments

Brevemente, BLAST (Basic Local Alignment Search Tool) es un método de búsqueda por homología, en el cuál se reta a la base de datos con una secuencia problema (query), para que encuentre secuencias relacionadas a nuestra secuencia problema.

Los resultados que BLAST arroja, son alineamientos pareados junto con los datos de la posición de la secuencia problema (query) con la secuencia que el programa encontró de la base de datos.

Uno de los problemas para hacer un alineamiento múltiple de las secuencias que encontramos en BLAST, es que los resultados solo arrojan links a las secuencias que nos interesan, de modo que hay que recuperar las secuencias una por una y además al hacer esto obtenemos la secuencia completa con residuos adicionales que no corresponden a la región que nos interesa (match) y por tanto obtenemos secuencias con una longitud distinta, lo cuál no es muy deseable para un alineamiento múltiple.

Así que si queremos visualizar los datos en forma de un alineamiento múltiple o generar archivos fasta con las secuencias alineadas, podemos utilizar MView el cual podemos descargar e instalar localmente en una maquina con linux, o también lo podemos utilizar en el portal Mobyle@pasteur.

Para hacer este análisis pueden seguirse los siguientes pasos:

  • Ir a Mobyle@pasteur.
  • En la pestaña program seleccionamos, database>homology>blast2
  • Ahora en la interfase web de blast2, seleccionamos como en la imagen: - Blast program: blastp
  • Proteín db: uniprot_sb
  • En la sección query sequence/query, para cargar la secuencia de ejemplo en la base de datos seleccionamos DB, después en la lista desplegable de abajo seleccionamos la base de datos uniprot y en el cuadro diálogo escribimos P25044 y damos click en Select.
  • Ahora el portal nos mostrará esta secuencia en el cuadro de diálogo más grande.
  • Ahora, vamos hacia la parte de arriba de la ventana y damos click en Run.
  • Y ahora el portal nos muestra los resultados.
  • Podemos ver que existen tres opciones para visualizar los resultados, como texto, html y de manera visual.
  • Seguido de donde están los resultados en texto, hay una lista desplegable seguida del botón further analysis.
  • Ahora seleccionamos de la lista mview(blast)>Further analysis.
  • Enseguida nos aparecerá la interfase web para mview con los resultados de blast, obtenidos anteriormente
  • Hay dos opciones que me parecen útiles para dar formato a los resultados de blast, por defecto está seleccionado html, lo que nos mostrará un alineamiento coloreado de la secuencias alineadas en blast. Pero si deseamos seguir trabajando con la secuencia, tenemos que obtener un archivo fasta, con todas las secuencias alineadas. Claro que también como podrán darse cuenta, hay muchas opciones, para poder filtrar las secuancias que queremos obtener, de momento solo vamos a usar otro programa para ver los resultados.
  • Seleccionamos Pearson/FASTA en el menú desplegable de la sección Output format (-out)
  • Y damos click en Run.
  • Ahora podemos ver como resultado un archivo con formato fasta de las secuencias.
  • De aqui, podemos seguir haciendo análisis filogenéticos u obtener estadísticas sobre el alineamiento, pero en este ejemplo, vamos a reformatear estos resultados con un programa de la suite EMBOSS, llamado showalign.
  • Similar a lo que hicimos para mandar los resultados de blast a mview, ahora vamos a seleccionar showalign(sequence).
  • Utilizando advanced options podemos seleccionar varias opciones para como queremos visualizar el alineamiento, como por ejemplo la scoring matrix y como queremos ver los residuos que no son idénticos
  • Por ejemplo podemos mostrar en los resultados los residuos similares y también ordenarlos de acuerdo a su similaridad con estas opciones
  • Para obtener el siguiente resultado:
  1. Neron, B., Menager, H., Maufrais, C., Joly, N., Maupetit, J., Letort, S., Carrere, S., Tuffery, P., & Letondal, C. (2009). Mobyle: a new full web bioinformatics framework. Bioinformatics, 25(22), 3005–3011. doi:10.1093/bioinformatics/btp493

Maartens Retrieval System (MRS)

| Comments

Maartens Retrieval System (MRS) es un metabuscador de bases de datos biológicas múy útil, algo así como un google para la minería de datos, el pasado 22 de marzo de 2011 hubo un curso en el CCG-UNAM impartido por George Magklaras sobre como combinar el uso de EMBOSS y MRS.

Desde mi punto de vista, la documentación del proyecto es algo pobre, pero su interfase web es muy intuitiva.

Su verdadero poder, está en la línea de comandos, sin embargo para poder usarla, se necesita tener acceso por SSH a una servidor con MRS instalado, para poder programar un “pipline or workflow” y hacer una minería de datos, si se tiene por ejemplo una lista de genes resultado de un microarreglo.

George Magklaras tiene dos entradas en su blog que hablan sobre la administración de esta plataforma

  1. Hekkelman, M. L., & Vriend, G. (2005). MRS: a fast and compact retrieval system for biological data. Nucleic Acids Research, 33(Web Server), W766–W769. doi:10.1093/nar/gki422