LinuxParty
Scikit-learn es una de las bibliotecas de aprendizaje automático más populares para Python, que proporciona una amplia gama de herramientas para el análisis de datos y tareas de aprendizaje automático, desde regresión lineal simple hasta algoritmos de agrupamiento avanzados.
Este artículo lo guiará a través de los pasos para instalar y usar Scikit-learn en un sistema Linux.
¿Qué es Scikit-learn?
Scikit-learn (también conocida como sklearn ) es una biblioteca Python gratuita y de código abierto que se utiliza para tareas de aprendizaje automático. Se basa en otras bibliotecas Python como NumPy , SciPy y matplotlib y ofrece una interfaz sencilla para algoritmos complejos de aprendizaje automático.
Algunas de las características clave de Scikit-learn incluyen:
- Aprendizaje supervisado (por ejemplo, clasificación, regresión).
- Aprendizaje no supervisado (por ejemplo, agrupamiento, reducción de dimensionalidad)
- Evaluación y validación de modelos
- Herramientas de preprocesamiento de datos
- Compatibilidad con múltiples formatos de datos y herramientas para la implementación de modelos
Instalación de Python en Linux
Scikit-learn está desarrollado con Python , por lo que es necesario tener Python instalado en el sistema. Puedes comprobar si Python ya está instalado escribiendo el siguiente comando en tu terminal:
python3 --versión
Si Python no está instalado, puedes instalarlo ejecutando:
sudo apt install python3 [En Debian, Ubuntu and Mint] sudo yum install python3 [En RHEL/CentOS/Fedora and Rocky/AlmaLinux] sudo emerge -a sys-apps/python3 [En Gentoo Linux] sudo apk add python3 [En Alpine Linux] sudo pacman -S python3 [En Arch Linux] sudo zypper install python3 [En OpenSUSE] sudo pkg install python3 [En FreeBSD]
Instalación de Pip en Linux
Pip es el administrador de paquetes de Python que se utiliza para instalar bibliotecas de Python como Scikit-learn . Para comprobar si pip está instalado, ejecute:
pip3 --versión
Si pip no está instalado, instálelo usando:
sudo apt install python3-pip [En Debian, Ubuntu and Mint] sudo yum install python3-pip [En RHEL/CentOS/Fedora and Rocky/AlmaLinux] sudo emerge -a dev-python/pip [En Gentoo Linux] sudo apk add py3-pip [En Alpine Linux] sudo pacman -S python-pip [En Arch Linux] sudo zypper install python3-pip [En OpenSUSE] sudo pkg install py38-pip [En FreeBSD]
Instalación de Scikit-learn en Linux
Ahora cree un entorno virtual ( venv ) e instale scikit-learn . Tenga en cuenta que el entorno virtual es opcional, pero muy recomendable, para evitar posibles conflictos con otros paquetes.
python3 -m venv sklearn-env source sklearn-env/bin/activate pip3 install -U scikit-learn
Este comando descargará e instalará la última versión de Scikit-learn junto con sus dependencias (como NumPy y SciPy ). Dependiendo de la velocidad de su conexión a Internet, esto puede demorar unos minutos.
Una vez completada la instalación, puedes verificar que Scikit-learn esté instalado correctamente importándolo en Python.
python3 -m pip show scikit-learn # muestra la versión y ubicación de scikit-learn python3 -m pip freeze # muestra todos los paquetes instalados en el entorno
python3 -c "import sklearn; sklearn.show_versions()"
Compruebe Scikit-Learn en Linux
Si no aparecen errores y se imprime el número de versión de Scikit-learn, la instalación es exitosa.
Cómo utilizar Scikit-learn en Linux
Una vez que haya instalado Scikit-learn , es hora de comenzar a usarlo con los siguientes ejemplos básicos de cómo usar Scikit-learn para diversas tareas de aprendizaje automático.
Ejemplo 1: Importación de Scikit-learn y carga de un conjunto de datos
Scikit-learn ofrece varios conjuntos de datos integrados para fines de aprendizaje. Un conjunto de datos popular es el conjunto de datos “ Iris ”, que contiene datos sobre diferentes especies de flores de iris.
Para cargar el conjunto de datos Iris , utilice el siguiente código:
from sklearn.datasets import load_iris # Cargar el conjunto de datos (dataset) iris = load_iris() # Imprimir las características y las etiquetas de destino print(iris.data) print(iris.target)
Ejemplo 2: División de datos en conjuntos de entrenamiento y prueba
Antes de aplicar modelos de aprendizaje automático, es importante dividir el conjunto de datos en conjuntos de entrenamiento y prueba, lo que garantiza que el modelo se entrene en un subconjunto de los datos y se pruebe en otro, evitando el sobreajuste.
Puede utilizar train_test_split
desde Scikit-learn para dividir los datos:
from sklearn.model_selection import train_test_spli # Split los datos en 80% de entrenamiento y 20% de prueba. X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42) print("Datos de entrenamiento:", X_train.shape) print("Datos de prueba:", X_test.shape)
Ejemplo 3: Entrenamiento de un modelo de aprendizaje automático
Ahora, entrenemos un modelo de aprendizaje automático con la ayuda de un clasificador simple, como una máquina de vectores de soporte ( SVM ), para clasificar las flores de iris.
from sklearn.model_selection import train_test_split # Crear un clasificador SVM model = SVC() # Entrenar el modelo con los datos de entrenamiento model.fit(X_train, y_train) # Predecir sobre los datos de prueba y_pred = model.predict(X_test) print("Etiquetas predichas:", y_pred)
Ejemplo 4: Evaluación del modelo
Después de entrenar el modelo, es importante evaluar su rendimiento. Puedes usar métricas como la precisión para ver qué tan bien está funcionando el modelo.
from sklearn.metrics import accuracy_score # Calcular precisión precision = accuracy_score(y_test, y_pred) print("Precisión:", precision)
Esto imprimirá la precisión del modelo, que representa el porcentaje de predicciones correctas realizadas por el modelo en los datos de prueba.
Conclusión
En este artículo, explicamos cómo instalar y usar Scikit-learn en un sistema Linux. Mostramos cómo instalarlo usando pip, cargar conjuntos de datos, dividir datos, entrenar modelos de aprendizaje automático y evaluar el rendimiento del modelo.
Scikit-learn es una herramienta potente y fácil de usar para el aprendizaje automático en Python. Con los pasos descritos anteriormente, puede comenzar su recorrido de aprendizaje automático y explorar la amplia gama de algoritmos y técnicas que ofrece Scikit-learn.
Al practicar y experimentar con diferentes algoritmos, conjuntos de datos y técnicas de evaluación de modelos, podrá crear soluciones de aprendizaje automático efectivas para problemas del mundo real.
-
Programación
- Cómo instalar y utilizar Scikit-Learn en Linux
- Thomas E. Kurtz, coinventor de BASIC, muere a los 96 años
- Profesor de informática del MIT prueba el impacto de la IA en la formación de programadores
- Lanzamiento del IDE de código abierto Qt Creator 14 con soporte para complementos basados en Lua
- Plantillas para Joomla - Episodio 1: Plantillas, marcos y clubes o no...
- Este es el mejor libro que he visto para aprender a programar en Python en castellano desde cero, gratis y online
- ¿Deberían los niños seguir aprendiendo a programar en la era de la IA?
- La 'obsolescencia' de VBScript confirmada por Microsoft y su eventual eliminación de Windows
- El Gran Debate: ¿Deberían los Modelos de Inteligencia Artificial Ser de Código Abierto?
- El lenguaje de programación BASIC cumple 60 años
- El CEO de Nvidia dice que los niños no deberían aprender a programar
- 40 años de Turbo Pascal: recuerdos del dinosaurio codificador que revolucionó los IDE
- Los lenguajes de programación más populares y dónde aprenderlos.
- Top 5 de los principales lenguajes de programación para desarrollar aplicaciones de escritorio Linux
- Qt Creator 12 lanzado con complementos de grabación de pantalla y Explorador de compiladores