BIOINFORMÁTICA

🔬 La intersección entre biología, computación y análisis de datos 💻

👨‍🎓 Estudiante: Ronaldo Ticona Jancco
🆔 Código: 211816
👨‍🏫 Docente: Jose Mauro Pillco Quispe
📅 Periodo: 2025-2V
5
Proyectos Completados
15+
Herramientas Dominadas
100+
Horas de Análisis
Posibilidades

Fundamentos Teóricos

🧠 La bioinformática es una disciplina científica interdisciplinaria que desarrolla métodos y herramientas de software para comprender datos biológicos, especialmente cuando los conjuntos de datos son grandes y complejos.

¿Qué es la Bioinformática?

La bioinformática combina biología, informática, matemáticas y estadística para analizar e interpretar datos biológicos. Se enfoca principalmente en el desarrollo de algoritmos y software para gestionar, analizar y visualizar datos genómicos, proteómicos y de expresión génica. Esta disciplina es fundamental para la medicina personalizada, el descubrimiento de fármacos, la investigación genética y la comprensión de procesos biológicos complejos.

🧬

Análisis de Secuencias

El análisis de secuencias es fundamental en bioinformática. Incluye el estudio de secuencias de ADN, ARN y proteínas para identificar similitudes, predecir funciones y entender relaciones evolutivas.

  • Alineamiento de secuencias (local y global)
  • Búsqueda de homología con BLAST
  • Análisis filogenético
  • Identificación de motivos y dominios
  • Predicción de estructura secundaria
📊

Genómica y Transcriptómica

Estudio a gran escala de genomas completos y perfiles de expresión génica. Permite entender cómo los genes se expresan en diferentes condiciones y tejidos.

  • Secuenciación de nueva generación (NGS)
  • Ensamblaje de genomas
  • Análisis de RNA-Seq
  • Identificación de genes diferencialmente expresados
  • Análisis de variantes genéticas
🔬

Biología Estructural

Predicción y análisis de estructuras tridimensionales de proteínas y ácidos nucleicos, esencial para entender su función biológica.

  • Modelado por homología
  • Predicción de estructura 3D
  • Docking molecular
  • Simulaciones de dinámica molecular
  • Análisis de interacciones proteína-ligando
💾

Bases de Datos Biológicas

Repositorios masivos de información biológica que facilitan el acceso, almacenamiento y análisis de datos experimentales.

  • GenBank (secuencias de nucleótidos)
  • PDB (estructuras proteicas)
  • UniProt (secuencias de proteínas)
  • KEGG (vías metabólicas)
  • Ensembl (genomas anotados)
🤖

Machine Learning en Biología

Aplicación de algoritmos de aprendizaje automático para descubrir patrones en datos biológicos complejos y hacer predicciones.

  • Clasificación de secuencias
  • Clustering de perfiles de expresión
  • Predicción de estructura proteica
  • Redes neuronales para análisis genómico
  • Deep learning en imágenes médicas
🌐

Biología de Sistemas

Enfoque holístico que integra datos de múltiples niveles biológicos para entender sistemas complejos.

  • Análisis de redes de interacción
  • Modelado de vías metabólicas
  • Integración multi-ómicas
  • Análisis de redes regulatorias
  • Simulación de sistemas biológicos

Trabajos Realizados

📂 Colección de proyectos y análisis realizados durante el curso, organizados por categoría temática.

01

Análisis de Secuencias Biológicas

🔍 Alineamiento, comparación y búsqueda de homología

🧬📈

Implementación de algoritmos de alineamiento de secuencias utilizando programación dinámica (Smith-Waterman y Needleman-Wunsch). Realización de búsquedas BLAST para identificar secuencias homólogas y análisis filogenético para determinar relaciones evolutivas entre especies. Aplicación de herramientas como ClustalW para alineamiento múltiple.

BLAST Alineamiento Múltiple Árboles Filogenéticos Python/Biopython ClustalW
02

Genómica Estructural y Modelado

🏗️ Predicción de estructuras 3D de proteínas

🔬⚛️

Uso de herramientas de modelado por homología (SWISS-MODEL, Modeller) para predecir estructuras tridimensionales de proteínas. Análisis de calidad de modelos mediante Ramachandran plots y QMEAN scores. Visualización de estructuras con PyMOL y análisis de sitios activos y dominios funcionales.

Modelado por Homología PyMOL SWISS-MODEL Validación de Modelos PDB
03

Análisis de Expresión Génica

📊 RNA-Seq y análisis diferencial

📉🧫

Procesamiento y análisis de datos de RNA-Seq para identificar genes diferencialmente expresados entre condiciones experimentales. Uso de herramientas como DESeq2 y edgeR en R. Análisis de enriquecimiento funcional (Gene Ontology, KEGG pathways) y visualización de resultados mediante heatmaps y volcano plots.

RNA-Seq DESeq2 R/Bioconductor Análisis Diferencial Gene Ontology
04

Bases de Datos y Minería de Datos

💾 Consultas y extracción de información biológica

🗄️🔎

Exploración y consulta programática de bases de datos biológicas (NCBI, UniProt, PDB, KEGG). Automatización de descarga y procesamiento de datos mediante APIs y scripts de Python. Integración de información de múltiples fuentes para análisis comprehensivos.

NCBI Entrez UniProt API PDB KEGG Biopython
05

Machine Learning Aplicado

🤖 Clasificación y predicción con datos biológicos

🧠💻

Implementación de modelos de machine learning (Random Forest, SVM, Redes Neuronales) para clasificación de secuencias y predicción de propiedades moleculares. Uso de scikit-learn y TensorFlow. Evaluación de modelos mediante validación cruzada y métricas de desempeño (accuracy, precision, recall, F1-score).

Scikit-learn Random Forest SVM Redes Neuronales Cross-validation

Herramientas Utilizadas

🛠️ Software, bibliotecas y plataformas empleadas en el desarrollo de los proyectos.

🐍

Python/Biopython

Lenguaje principal y librería para análisis bioinformático

📊

R/Bioconductor

Análisis estadístico y visualización de datos genómicos

💥

BLAST

Búsqueda de similitud de secuencias

🔮

PyMOL

Visualización de estructuras moleculares

📓

Jupyter Notebook

Entorno de desarrollo interactivo

🗂️

NCBI Tools

Acceso a bases de datos biológicas

🎯

Scikit-learn

Machine learning para análisis predictivo

🌳

MEGA

Análisis evolutivo molecular