# ‚öõÔ∏è Simulaci√≥n de Din√°mica Molecular con OpenMM en Google Colab

Este cuaderno gu√≠a el proceso completo de **preparaci√≥n y simulaci√≥n de un sistema proteico** (por ejemplo, un complejo prote√≠na‚Äìnanobody) usando **OpenMM**. Est√° dise√±ado para ejecutarse paso a paso, desde la preparaci√≥n de la estructura hasta la generaci√≥n de la trayectoria de din√°mica molecular.

---

## üìå Flujo del an√°lisis y funci√≥n de cada celda

1. **Instalaci√≥n de librer√≠as (Celda 1 y 2)**  
   - Instala las librer√≠as necesarias:  
     - `openmm` ‚Üí motor de simulaci√≥n.  
     - `pdbfixer` ‚Üí preparaci√≥n de estructuras.  
     - `biopython` ‚Üí conversi√≥n de archivos CIF a PDB.  
     - `py3Dmol` ‚Üí visualizaci√≥n 3D interactiva.  
   - ‚ö†Ô∏è En Colab se requiere un reinicio autom√°tico del kernel (ya gestionado en el script). Despu√©s de este reinicio, continuar directamente en la celda ‚ÄúPaso B‚Äù.

2. **Conversi√≥n de estructura (Celda 3)**  
   - Permite subir un archivo en formato **CIF** (por ejemplo, generado en AlphaFold o RCSB PDB).  
   - Lo convierte autom√°ticamente en **PDB**, que es el formato est√°ndar para simulaciones en OpenMM.

3. **Preparaci√≥n del sistema (Celda 4)**  
   - Limpia y centra el complejo proteico.  
   - A√±ade **hidr√≥genos** y ajusta el pH fisiol√≥gico (7.4).  
   - A√±ade **solvente (agua TIP3P)** e **iones** para neutralizar la carga.  
   - Aplica el campo de fuerza **Amber14**.  
   - Guarda el sistema preparado como `protein_system_CORRECTED.pdb`.

4. **Configuraci√≥n y ejecuci√≥n de la simulaci√≥n (Celda 5)**  
   - Define los par√°metros de la simulaci√≥n (temperatura, integrador, paso de tiempo).  
   - Selecciona la **plataforma de ejecuci√≥n** (CUDA u OpenCL si hay GPU, o CPU en su defecto).  
   - Ejecuta tres fases:  
     - **Minimizaci√≥n de energ√≠a** ‚Üí eliminar choques iniciales.  
     - **Equilibrado** ‚Üí estabilizar la temperatura y presi√≥n.  
     - **Producci√≥n** ‚Üí simulaci√≥n de 10 ns (5,000,000 pasos de 2 fs).  
   - Guarda la trayectoria en formato `.dcd`.

5. **Descarga de resultados (Celda 6)**  
   - Permite descargar:  
     - `protein_system_CORRECTED.pdb` ‚Üí estructura inicial del sistema preparado.  
     - `trajectory.dcd` ‚Üí trayectoria completa de la simulaci√≥n (coordenadas de todos los √°tomos a lo largo del tiempo).

---

## üìä Resultados esperados
- **Trayectoria MD en formato `.dcd`** lista para an√°lisis (RMSD, contactos, energ√≠a libre, etc.).  
- **Sistema inicial `.pdb`** correctamente preparado con solvente e iones.  
- **Logs de simulaci√≥n** con temperatura, energ√≠a potencial y velocidad.  

---

‚û°Ô∏è En conjunto, este cuaderno permite pasar **de una estructura cruda (CIF)** a una **simulaci√≥n de din√°mica molecular de 10 ns**, todo dentro de Google Colab y sin necesidad de instalaci√≥n local.


In [None]:
# --- Celda 1 Instalar librer√≠as para la simulaci√≥n y el manejo de archivos PDB/CIF ---
print("Instalando OpenMM para la simulaci√≥n...")
!pip install openmm &> /dev/null

print("Instalando PDBFixer para preparar la estructura...")
!pip install pdbfixer &> /dev/null

print("Instalando BioPython para la conversi√≥n de CIF a PDB...")
!pip install biopython &> /dev/null

print("Instalando py3Dmol para la visualizaci√≥n 3D...")
!pip install py3Dmol &> /dev/null

print("\n¬°Instalaci√≥n completada!")

Instalando OpenMM para la simulaci√≥n...
Instalando PDBFixer para preparar la estructura...
Instalando BioPython para la conversi√≥n de CIF a PDB...
Instalando py3Dmol para la visualizaci√≥n 3D...

¬°Instalaci√≥n completada!


In [None]:
# --- Celda 2: Instalaci√≥n y Reinicio Forzado ---
print("Instalando todas las librer√≠as necesarias...")
!pip install openmm pdbfixer biopython py3Dmol &> /dev/null
print("¬°Instalaci√≥n completada!")
print("\n!!! ACCI√ìN REQUERIDA !!!")
print("El entorno se reiniciar√° ahora. Despu√©s del reinicio, NO vuelvas a ejecutar esta celda.")
print("Contin√∫a con la celda que te he proporcionado como 'Paso B'.")

# Esta l√≠nea reinicia el kernel de Python, que es m√°s limpio que un colapso.
import os
os.kill(os.getpid(), 9)

Instalando todas las librer√≠as necesarias...


In [None]:
# --- Celda 3: Subir y Convertir (Post-Reinicio) ---
from google.colab import files
from Bio.PDB import MMCIFParser, PDBIO
import os

# Subir el archivo .cif
print("Por favor, selecciona de nuevo tu archivo .cif:")
uploaded = files.upload()
cif_filename = list(uploaded.keys())[0]
print(f"Archivo '{cif_filename}' subido.")

# Convertir a .pdb
pdb_filename = "protein.pdb"
print(f"Convirtiendo '{cif_filename}' a '{pdb_filename}'...")
parser = MMCIFParser(QUIET=True)
structure = parser.get_structure("alphafold_structure", cif_filename)
io = PDBIO()
io.set_structure(structure)
io.save(pdb_filename)
print("¬°Conversi√≥n completada!")

Por favor, selecciona de nuevo tu archivo .cif:


Saving fold_2025_07_18_13_00_model_0.cif to fold_2025_07_18_13_00_model_0.cif
Archivo 'fold_2025_07_18_13_00_model_0.cif' subido.
Convirtiendo 'fold_2025_07_18_13_00_model_0.cif' a 'protein.pdb'...
¬°Conversi√≥n completada!


In [None]:
# --- Celda 4 de Preparaci√≥n (Versi√≥n CORRECTA y Definitiva) ---
print("--- Iniciando preparaci√≥n del sistema (m√©todo robusto) ---")

from openmm.app import *
from openmm import *
from openmm.unit import *
from sys import stdout
import numpy as np

# 'pdb_filename' deber√≠a existir desde la celda de conversi√≥n anterior
if 'pdb_filename' not in locals():
    pdb_filename = "protein.pdb" # Fallback por si acaso

try:
    print(f"\n[Paso 1/4] Cargando la estructura desde '{pdb_filename}'...")
    pdb = PDBFile(pdb_filename)
    modeller = Modeller(pdb.topology, pdb.positions)
    forcefield = ForceField('amber14-all.xml', 'amber14/tip3p.xml')
    print("Campo de fuerza cargado.")

    print(f"\n[Paso 2/4] Centrando el complejo y a√±adiendo hidr√≥genos...")
    positions_nm = np.array(modeller.positions.value_in_unit(nanometer))
    center = positions_nm.mean(axis=0)
    modeller.positions -= center * nanometer
    modeller.addHydrogens(forcefield, pH=7.4)
    print("Complejo centrado e hidrogenado.")

    print(f"\n[Paso 3/4] A√±adiendo solvente (agua) e iones...")
    modeller.addSolvent(forcefield, padding=1.0*nanometer, model='tip3p')
    modeller.addExtraParticles(forcefield)
    print("Solvente e iones a√±adidos.")

    final_pdb_filename = 'protein_system_CORRECTED.pdb'
    PDBFile.writeFile(modeller.topology, modeller.positions, open(final_pdb_filename, 'w'))
    print(f"Sistema final y CORRECTO guardado en '{final_pdb_filename}'.")

    print(f"\n[Paso 4/4] Creando el sistema de OpenMM...")
    system = forcefield.createSystem(modeller.topology, nonbondedMethod=PME,
            nonbondedCutoff=1.0*nanometer, constraints=HBonds)

    print("\n¬°Preparaci√≥n del sistema completada con √©xito!")

except Exception as e:
    print(f"\nOcurri√≥ un error durante la preparaci√≥n: {e}")

--- Iniciando preparaci√≥n del sistema (m√©todo robusto) ---

[Paso 1/4] Cargando la estructura desde 'protein.pdb'...
Campo de fuerza cargado.

[Paso 2/4] Centrando el complejo y a√±adiendo hidr√≥genos...
Complejo centrado e hidrogenado.

[Paso 3/4] A√±adiendo solvente (agua) e iones...
Solvente e iones a√±adidos.
Sistema final y CORRECTO guardado en 'protein_system_CORRECTED.pdb'.

[Paso 4/4] Creando el sistema de OpenMM...

¬°Preparaci√≥n del sistema completada con √©xito!


In [None]:
# --- Celda 5 SIMULACION de Minimizaci√≥n, Equilibrado y Producci√≥n 10 ns---
print("--- Iniciando la simulaci√≥n de Din√°mica Molecular ---")

# --- Paso 1: Configurar la simulaci√≥n ---
# El Integrador define c√≥mo se actualizan las posiciones y velocidades en cada paso de tiempo.
# Usamos un LangevinIntegrator, que es bueno para mantener la temperatura constante (termostato).
integrator = LangevinIntegrator(300*kelvin, 1/picosecond, 2*femtoseconds)

# La plataforma indica d√≥nde se ejecutar√° la simulaci√≥n.
# Intentamos usar la GPU ('CUDA' o 'OpenCL') que es mucho m√°s r√°pida. Si no, usa la CPU.
try:
    platform = Platform.getPlatformByName('CUDA')
    properties = {'CudaPrecision': 'mixed'}
    print("Plataforma de simulaci√≥n: CUDA (GPU)")
except Exception:
    try:
        platform = Platform.getPlatformByName('OpenCL')
        properties = {'OpenCLPrecision': 'mixed'}
        print("Plataforma de simulaci√≥n: OpenCL (GPU)")
    except Exception:
        platform = Platform.getPlatformByName('CPU')
        properties = {}
        print("Plataforma de simulaci√≥n: CPU")


# El objeto 'Simulation' une todo: topolog√≠a, sistema, integrador y plataforma.
simulation = Simulation(modeller.topology, system, integrator, platform, properties)

# Asignamos las posiciones iniciales (las que preparamos en la celda anterior)
simulation.context.setPositions(modeller.positions)
print("Configuraci√≥n de la simulaci√≥n completada.")


# --- Paso 2: Minimizaci√≥n de Energ√≠a ---
print("\nPaso 2: Minimizando la energ√≠a del sistema...")
simulation.minimizeEnergy()
print("Minimizaci√≥n completada.")


# --- Paso 3: Equilibrado y Producci√≥n ---
# Configuramos los "reporteros", que son los encargados de guardar los datos.
# Guardaremos datos cada 1000 pasos (equivalente a 2 ps).
report_interval = 1000

# Reportero para mostrar el progreso en la pantalla
simulation.reporters.append(StateDataReporter(stdout, report_interval, step=True,
        potentialEnergy=True, temperature=True, progress=True, remainingTime=True,
        speed=True, totalSteps=5000000, separator='\t'))

# Reportero para guardar la trayectoria (los movimientos) en un archivo .dcd
# Guardaremos 500 ps de simulaci√≥n (250,000 pasos * 2 fs/paso)
simulation.reporters.append(DCDReporter('trajectory.dcd', report_interval))
print("\nReporteros configurados. La simulaci√≥n de producci√≥n comenzar√° ahora.")
print("Esto puede tardar varios minutos...")


# ¬°Ejecutamos la simulaci√≥n!
# 500,000 pasos con un paso de tiempo de 2 fs nos dan 1 nanosegundo (ns) de simulaci√≥n.
# Para una prueba r√°pida, usamos 250,000 pasos (500 picosegundos).
# Puedes aumentar este n√∫mero para una simulaci√≥n m√°s larga.
# ¬°Ejecutamos la simulaci√≥n!
# 2,500,000 pasos con un paso de tiempo de 2 fs nos dan 5 nanosegundos (ns) de simulaci√≥n.
simulation.step(5000000)


print("\n\n¬°SIMULACI√ìN COMPLETADA!")

[1;30;43mSe han truncado las √∫ltimas 5000 l√≠neas del flujo de salida.[0m
0.1%	4000	-367479.7595935706	296.27218733467134	152	1:34:45
0.1%	5000	-368031.48014716594	297.93418657148027	156	1:32:26
0.1%	6000	-367545.8443354126	301.75927838530947	158	1:30:50
0.1%	7000	-366735.5402327366	302.21330786933976	160	1:29:49
0.2%	8000	-367199.779022702	299.99361549885424	161	1:29:06
0.2%	9000	-367871.30605889997	302.92977312381515	162	1:28:42
0.2%	10000	-367692.4232859574	300.25502695706456	163	1:28:17
0.2%	11000	-367625.55316398735	299.3675623366142	163	1:28:00
0.2%	12000	-367394.91035853606	299.33408112463735	164	1:27:41
0.3%	13000	-368126.00254336675	298.7024841984426	164	1:27:34
0.3%	14000	-367972.4546606324	298.37193551387867	163	1:27:54
0.3%	15000	-367700.0908239456	298.67441100481864	163	1:28:12
0.3%	16000	-367532.03055748413	298.7759171868229	162	1:28:20
0.3%	17000	-367051.3850042224	299.7052570405158	163	1:28:11
0.4%	18000	-368093.2808533518	302.4108477930236	163	1:28:01
0.4%	19000	-36

In [None]:
# --- Celda 6 Descagr de resultados ---
from google.colab import files

print("Descargando el archivo de topolog√≠a/estructura inicial...")
files.download('protein_system_CORRECTED.pdb')

print("\nDescargando el archivo de trayectoria...")
files.download('trajectory.dcd')

Descargando el archivo de topolog√≠a/estructura inicial...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>


Descargando el archivo de trayectoria...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>