Python For Proteomics
Instalación del Entorno en Windows 7/8/10
y
Primeros Pasos
versión 2.4 (February 2020)
Autores/Profesores Joaquín Abián Moñux
Gianluca Arauz Óscar Gallardo Román
Índice de contenidos
Introducción... 1
El entorno de Python para el curso P4P... 1
Instalar el entorno de Python para el curso P4P... 2
JupyterLab, notebooks y consolas... 5
Interfaz de JupyterLab... 5
Notebooks y consolas... 8
Introducción
Python es un lenguaje de programación interpretado (los programas se pueden probar rápidamente sin compilarlos primero), orientado a objetos y con una sintaxis muy cercana al lenguaje natural, por lo que es fácil de aprender y de utilizar para escribir programas o scripts de manera rápida, concisa y eficiente (sin necesidad de escribir cientos de líneas de código para realizar tareas sencillas).
En el campo del análisis de datos, Python está ganando gran relevancia en los últimos tiempos, ya que provee de potentes herramientas para el manejo, transformación y visualización de datos.
Su uso permite automatizar procedimientos rutinarios mediante scripts reutilizables y
flexibles, que al mismo tiempo permiten el tratamiento de los datos de manera reproducible y trazable, evitando los errores y otros problemas inherentes al tratamiento manual de datos con hojas de cálculo.
Adicionalmente, el gran número de usuarios de este lenguaje en diversos campos de
aplicación y especialmente en el ámbito científico, facilita la resolución de los problemas que nos podamos encontrar en nuestro proceso de análisis de datos y programación.
El entorno de Python para el curso P4P
Para el curso P4P utilizaremos un entorno pre-empaquetado, que ya incluye tanto el intérprete de Python 3.7 como los paquetes necesarios para el curso y sus dependencias.
Éste entorno ha sido creado utilizando c onda , un programa
multiplataforma (para Windows, GNU/Linux y macOS X) que permite gestionar (instalar, actualizar, desinstalar) tanto paquetes para Python y sus dependencias, como otros componentes necesarios para el desarrollo de aplicaciones y el análisis de datos en Python, R, Scala, Ruby …
En concreto, se recurrió al instalador Miniconda, que genera un entorno mínimo de Python (el intérprete de Python y unos pocos paquetes extra, incluyendo el gestor conda) sin necesidad de ser administrador y sin interferir con otros intérpretes de Python que puedan estar ya
instalados en el equipo. Sobre este entorno mínimo se instaló todo lo necesario para poder realizar el curso:
• Los paquetes de Python que necesitaremos durante el curso (Biopython, Numpy, matplotlib, pyteomics, pandas, seaborn, ….) así como sus dependencias, y también el entorno de desarrollo y análisis de datos JupyterLab. Para ello se utilizó básicamente el gestor de paquetes y programas conda.
• Los documentos del curso, así como los ficheros de datos que utilizaremos para los diferentes ejemplos de código y de análisis de datos.
Y todo el entorno así generado se empaquetó en un archivo comprimido, mediante el uso del paquete conda-pack, para poder así trasladarlo a otros ordenadores en los que
desempaquetarlo para obtener un entorno reproducible y listo, de manera rápida y sencilla.
Página 1
Instalar el entorno de Python para el curso P4P
1
Con el fin de simplificar y agilizar esta tarea, se ha generado (utilizando 7-zip y scripts de desarrollo propio) un archivo comprimido auto-extraíble y auto-desempaquetable.Puedes bajar éste archivo, llamado conda-pack_WIN_2020-01-24.exe , desde cualquiera de los siguientes repositorios:
BitBucket:
https://bitbucket.org/lp-csic-uab/python4proteomics/ downloads / Mega:
https://mega.nz/#F!QxxWUK5a!Oc3EiaNVXJZ9cF5uRPcwWQ
2
Crea una nueva carpeta/folder que se llame p4p dentro de tu carpeta de usuario; de manera que la ruta completa de la carpeta sea (la « Carpeta de instalación\ »):C:\Users\tu_nombre_de_usuario\p4p
3
Ejecutar el archivo auto-extraíble conda-pack_WIN_2020-01-24.exe Cuándo pregunte dónde extraer los archivos del entorno (Extract to:) indicarle la ruta completa de la nueva carpeta que creasteis (ver captura de pantalla a continuación).Una vez indicada la carpeta de instalación, haremos clic en el botón Extract, y esperaremos a que termine el proceso de descompresión en dicha carpeta:
4
Cuándo termine la descompresión en la Carpeta de instalación\ , dentro de ésta habrá muchas carpetas y archivos nuevos.De todos estos archivos, ejecutaremos el script de desenpaquetado del entorno, llamado conda-unpack.bat :
5
Se abrirá entonces una ventana de línea de comandos en la que se mostraran los diferentes pasos que irá ejecutando este script con el fin de desempaquetar el entorno del curso, adaptándolo a su nueva ubicación, y de crear los accesos directos necesarios en el menú Inicio de Windows:Página 3
6
Si todo funciona correctamente, al final de estas líneas os pedirá pulsar cualquier tecla.Pulsar. La instalación está concluida.
7
Ahora, entre vuestros programas en el menú Inicio podréis encontrar la carpeta Anaconda3 con diversas herramientas.La que utilizaremos a lo largo del curso es el entorno de programación y análisis de datos JupyterLab, que ya podemos lanzar haciendo clic en la entrada que se ha añadido a:
• Windows 7:
Inicio Todos los programas Anaconda3 ➤ ➤ ➤ JupyterLab
• Windows 10:
Iniciar Anaconda3 ➤ ➤ JupyterLab
JupyterLab, notebooks y consolas
Durante el presente curso utilizaremos el entorno de
desarrollo y análisis de datos JupyterLab, que hemos instalado en el paso anterior (junto al resto de librerías y paquetes necesarios).
JupyterLab proporciona un espacio de trabajo que permite visualizar y trabajar con múltiples archivos de datos (CSV, JSON, Excel), documentos (imágenes, PDFs, Markdown), editores de código, Jupyter notebooks, consolas de código, y otras actividades, de forma flexible, integrada, y extensible. Todo ello con el objetivo de explorar los datos y crear flujos de trabajo de manera interactiva.
Interfaz de JupyterLab
Una vez lanzado JupyterLab desde su entrada en el menú Inicio, deberíamos ver como se abren dos nuevas ventanas:
• Una primera ventana de terminal en la que se ejecutará la parte servidor de
JupyterLab: el entorno Jupyter, las diferentes kernels (núcleos de ejecución de código) que se vayan necesitando según las diferentes actividades que vayamos lanzando dentro de JupyterLab, y un servidor web local.
Por tanto, es muy importante no cerrar esta ventana hasta terminar de trabajar con JupyterLab.
• Y una ventana del navegador web, dónde se nos mostrará la interfaz web de JupyterLab (su parte cliente, conectada a la parte servidor en la dirección local http://localhost:8888/lab), con la que interactuaremos, y que estará en continua comunicación con la parte servidor anterior.
Para el correcto funcionamiento de esta interfaz web, es imprescindible que nuestro navegador web sea un navegador compatible: Firefox; o alguno de los navegadores basados en Chromium, como Chrome, Opera, Fal k on .
Página 5
Como se puede ver en la imagen, la interfaz web de JupyterLab consta de una barra de menús en la parte superior. Debajo de ésta, la ventana se encuentra dividida en una barra lateral a la izquierda y el área de trabajo a la derecha. En la parte inferior podemos observar la barra de estado (Status Bar):
• Barra lateral (Sidebar): puede mostrar diferentes vistas (o paneles de utilidades) dependiendo del botón lateral que se presione:
Explorador de Ficheros (File Browser): es la vista por defecto. Sirve para buscar y abrir (doble clic) los archivos compatibles para trabajar con ellos en el área de trabajo. Además permite gestionar (renombrar, copiar, mover, borrar, …) los archivos y carpetas que se muestran (ya sea arrastrándolos o haciendo clic con el botón derecho/secundario sobre ellos).
Terminales y Kernels en Ejecución (Running Terminals and Kernels): esta vista permite comprobar qué sesiones de terminal y qué núcleos de ejecución de código (kernels) están activos (en ejecución), cambiar a las actividades que los están utilizando (clic en el nombre), y detenerlos (clic en shut down) si fuera preciso.
Comandos (Commands): muestra una lista con todos los comandos/acciones
Herramientas del Notebook (Notebook Tools): sólo está disponible cuando hay algún notebook abierto. Permite inspeccionar y modificar las propiedades de cada una de celdas que conforman el notebook activo. Gracias a la extensión cell-tags añadida a JupyterLab también se pueden añadir etiquetas (tags) a las celdas, seleccionar las celdas que contengan una determinada etiqueta, ...
Pestañas Abiertas (Open Tabs): muestra los nombres de todas las pestañas del área de trabajo correspondientes a actividades abiertas, pudiendo cambiar entre ellas (clic en el nombre) o cerrarlas (clic en la Ⓧ a la derecha del nombre).
Tabla de Contenidos (Table of Contents): esta vista es una extensión añadida a JupyterLab que nos permitirá ver y navegar fácilmente entre las diferentes secciones (definidas por títulos y encabezados) del notebook activo.
• Área de trabajo: es el área en la que trabajaremos con las diferentes actividades (documentos, archivos de datos, notebooks, consolas, …) que vayamos abriendo.
Por defecto se muestra la pestaña del Launcher, el cual contiene varios accesos directos para crear nuevos notebooks , iniciar nuevas consolas de código , iniciar sesiones de terminal del sistema , crear nuevos scripts de Python , documentos de texto plano , o de texto en formato markdown , ...
Cada documento o actividad nueva que creemos desde el Launcher (o, alternativamente, usando el menú File ➤New ...), o que abramos desde el
Explorador de Ficheros de la barra lateral, se mostrará como una pestaña más en el área de trabajo.
Además, para facilitar la visualización y manipulación de múltiples actividades, el área de trabajo puede subdividirse en diferentes zonas, según dónde arrastremos las
pestañas de las actividades.
Para mayor flexibilidad, las diferentes áreas son redimensionables; y la barra lateral puede ocultarse (para así disponer de más espacio en el área de trabajo), bien haciendo clic en el botón de la vista actualmente activa de la barra lateral, bien desmarcando la opción "Show Left Sidebar" del menú "View".
Página 7
Notebooks y consolas
Por último, te recomendamos que abras el notebook 0.0 First Notebook.ipynb para empezar a familiarizarte con los notebooks y las consolas, aprendiendo los conceptos básicos que se explican en él.
Para ello, en el Explorador de Ficheros de la Barra lateral haz doble clic sobre las carpetas para moverte primero dentro de la carpeta de instalación del entorno , y luego dentro de la carpeta P4P_Course .
Después, haz doble clic sobre el fichero 0.0 First Notebook.ipynb para que se abra el notebook en el Área de trabajo: