LinuxParty

NUESTRO SITIO necesita la publicidad para costear hosting y el dominio. Por favor considera deshabilitar tu AdBlock en nuestro sitio. También puedes hacernos una donación entrando en linuxparty.es, en la columna de la derecha.
Inicio desactivadoInicio desactivadoInicio desactivadoInicio desactivadoInicio desactivado
 

Scikit-learn es una de las bibliotecas de aprendizaje automático más populares para Python, que proporciona una amplia gama de herramientas para el análisis de datos y tareas de aprendizaje automático, desde regresión lineal simple hasta algoritmos de agrupamiento avanzados.

Este artículo lo guiará a través de los pasos para instalar y usar Scikit-learn en un sistema Linux.

¿Qué es Scikit-learn?

Scikit-learn (también conocida como sklearn ) es una biblioteca Python gratuita y de código abierto que se utiliza para tareas de aprendizaje automático. Se basa en otras bibliotecas Python como NumPy , SciPy y matplotlib y ofrece una interfaz sencilla para algoritmos complejos de aprendizaje automático.

Algunas de las características clave de Scikit-learn incluyen:

  • Aprendizaje supervisado (por ejemplo, clasificación, regresión).
  • Aprendizaje no supervisado (por ejemplo, agrupamiento, reducción de dimensionalidad)
  • Evaluación y validación de modelos
  • Herramientas de preprocesamiento de datos
  • Compatibilidad con múltiples formatos de datos y herramientas para la implementación de modelos

Instalación de Python en Linux

Scikit-learn está desarrollado con Python , por lo que es necesario tener Python instalado en el sistema. Puedes comprobar si Python ya está instalado escribiendo el siguiente comando en tu terminal:

python3 --versión

Si Python no está instalado, puedes instalarlo ejecutando:

sudo apt install python3         [En Debian, Ubuntu and Mint]
sudo yum install python3         [En RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a sys-apps/python3  [En Gentoo Linux]
sudo apk add python3             [En Alpine Linux]
sudo pacman -S python3           [En Arch Linux]
sudo zypper install python3      [En OpenSUSE]    
sudo pkg install python3         [En FreeBSD]

Instalación de Pip en Linux

Pip es el administrador de paquetes de Python que se utiliza para instalar bibliotecas de Python como Scikit-learn . Para comprobar si pip está instalado, ejecute:

pip3 --versión

Si pip no está instalado, instálelo usando:

sudo apt install python3-pip         [En Debian, Ubuntu and Mint]
sudo yum install python3-pip         [En RHEL/CentOS/Fedora and Rocky/AlmaLinux]
sudo emerge -a dev-python/pip        [En Gentoo Linux]
sudo apk add py3-pip                 [En Alpine Linux]
sudo pacman -S python-pip            [En Arch Linux]
sudo zypper install python3-pip      [En OpenSUSE]    
sudo pkg install py38-pip            [En FreeBSD]

Instalación de Scikit-learn en Linux

Ahora cree un entorno virtual ( venv ) e instale scikit-learn . Tenga en cuenta que el entorno virtual es opcional, pero muy recomendable, para evitar posibles conflictos con otros paquetes.

python3 -m venv sklearn-env
source sklearn-env/bin/activate
pip3 install -U scikit-learn

Este comando descargará e instalará la última versión de Scikit-learn junto con sus dependencias (como NumPy y SciPy ). Dependiendo de la velocidad de su conexión a Internet, esto puede demorar unos minutos.

Una vez completada la instalación, puedes verificar que Scikit-learn esté instalado correctamente importándolo en Python.

python3 -m pip show scikit-learn      # muestra la versión y ubicación de scikit-learn
python3 -m pip freeze                 # muestra todos los paquetes instalados en el entorno
python3 -c "import sklearn; sklearn.show_versions()"

Compruebe Scikit-Learn en Linux

Si no aparecen errores y se imprime el número de versión de Scikit-learn, la instalación es exitosa.

Cómo utilizar Scikit-learn en Linux

Una vez que haya instalado Scikit-learn , es hora de comenzar a usarlo con los siguientes ejemplos básicos de cómo usar Scikit-learn para diversas tareas de aprendizaje automático.

Ejemplo 1: Importación de Scikit-learn y carga de un conjunto de datos

Scikit-learn ofrece varios conjuntos de datos integrados para fines de aprendizaje. Un conjunto de datos popular es el conjunto de datos “ Iris ”, que contiene datos sobre diferentes especies de flores de iris.

Para cargar el conjunto de datos Iris , utilice el siguiente código:

from sklearn.datasets import load_iris

# Cargar el conjunto de datos (dataset)
iris = load_iris()

# Imprimir las características y las etiquetas de destino
print(iris.data)
print(iris.target)

Ejemplo 2: División de datos en conjuntos de entrenamiento y prueba

Antes de aplicar modelos de aprendizaje automático, es importante dividir el conjunto de datos en conjuntos de entrenamiento y prueba, lo que garantiza que el modelo se entrene en un subconjunto de los datos y se pruebe en otro, evitando el sobreajuste.

Puede utilizar train_test_split desde Scikit-learn para dividir los datos:

from sklearn.model_selection import train_test_spli

# Split los datos en 80% de entrenamiento y 20% de prueba. 
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=42)

print("Datos de entrenamiento:", X_train.shape) 
print("Datos de prueba:", X_test.shape)

Ejemplo 3: Entrenamiento de un modelo de aprendizaje automático

Ahora, entrenemos un modelo de aprendizaje automático con la ayuda de un clasificador simple, como una máquina de vectores de soporte ( SVM ), para clasificar las flores de iris.

from sklearn.model_selection import train_test_split

# Crear un clasificador SVM
model = SVC()

# Entrenar el modelo con los datos de entrenamiento
model.fit(X_train, y_train)

# Predecir sobre los datos de prueba
y_pred = model.predict(X_test)

print("Etiquetas predichas:", y_pred)

Ejemplo 4: Evaluación del modelo

Después de entrenar el modelo, es importante evaluar su rendimiento. Puedes usar métricas como la precisión para ver qué tan bien está funcionando el modelo.

from sklearn.metrics import accuracy_score

# Calcular precisión
precision = accuracy_score(y_test, y_pred)

print("Precisión:", precision)

Esto imprimirá la precisión del modelo, que representa el porcentaje de predicciones correctas realizadas por el modelo en los datos de prueba.

Conclusión

En este artículo, explicamos cómo instalar y usar Scikit-learn en un sistema Linux. Mostramos cómo instalarlo usando pip, cargar conjuntos de datos, dividir datos, entrenar modelos de aprendizaje automático y evaluar el rendimiento del modelo.

Scikit-learn es una herramienta potente y fácil de usar para el aprendizaje automático en Python. Con los pasos descritos anteriormente, puede comenzar su recorrido de aprendizaje automático y explorar la amplia gama de algoritmos y técnicas que ofrece Scikit-learn.

Al practicar y experimentar con diferentes algoritmos, conjuntos de datos y técnicas de evaluación de modelos, podrá crear soluciones de aprendizaje automático efectivas para problemas del mundo real.

No estás registrado para postear comentarios



Redes:



   

 

Suscribete / Newsletter

Suscribete a nuestras Newsletter y periódicamente recibirás un resumen de las noticias publicadas.

Donar a LinuxParty

Probablemente te niegues, pero.. ¿Podrías ayudarnos con una donación?


Tutorial de Linux

Filtro por Categorías