Metodología
Esta página ha sido creada como herramienta para el análisis de datos del proyecto "Derechos lingüísticos en la atención sanitaria vasca" de Euskera Denontzat. Esta colaboración nace del Medialab Tabakalera organizado por Taller datos para la acción y mediado por Estudio Montera34
El proyecto quiere analizar los medios y los trabajadores bilingües necesarios por cada comarca, para garantizar los derechos lingüísticos en Osakidetza.
Objetivos
- Racionalizar el debate sobre derechos lingüísticos y laborales, basándolo en datos.
Metodología
Acreditaciones y requisitos de Euskera del Personal de Osakidetza
Origen: Gobierno Vasco
Enlace externo: https://www.legebiltzarra.eus/ords/f?p=120:18:5739858556038::NO:RP,RIR:P18_ID,P18_EXPAND:85998,N
Documento original: 250401083850131002.xlsx
Fecha de publicación: 27 de marzo de 2025
Consultado: 14 noviembre 2025
Preferencias lingüísticas de usuarios de Osakidetza
Origen: Gobierno Vasco
Documento original: 20250530_3481_2_Stamped.pdf
Fecha de publicación: 2 de junio de 2025
Consultado: 14 noviembre 2025
Zonificación geográfica
Origen: EuskalGeo / Gaindegia
Zonificación administrativa: https://www.euskalgeo.eus/eu/deskargak/zonifikazio-administratiboa
Archivo GeoJSON procesado: osis-puestos-2025_simply.json
Listado OSIs
Origen: Gobierno Vasco
Listado OSIs: listado_osis.pdf
Fecha de publicación: septiembre de 2016
Estos datos han sido procesados para obtener la estructura necesaria para crear esta herramienta.
Procesado de datos
En el análisis inicial se han identificado la siguiente estructura de datos según dataset:
Personal osakidetza (XLSX):
- Comarcas OSI.
Acreditados Si/No por comarca.
- Categoría profesional
Acreditados Si/No por comarca/categoría.
- Comarcas OSI.
Requisitos Si/No por comarca/categoría.
- Categoría profesional.
Requisitos Si/No por comarca/categoría.
Preferencia lingüística (PDF):
- Columna de comarcas OSI.
- Columnas de datos por comarca.
- Datos totalizados por comarca.
- Datos de preferencias por género y pacientes pediátricos y adultos.
Los datos de las tablas del "Personal osakidetza" son tablas dinámicas incrustadas que solo son accesibles a través de Microsoft Excel. Utilizando dicha herramienta se han transformado los datos para generar un dataset con la siguiente estructura de denominadores comunes:
Personal osakidetza:
- Columna de comarcas OSI.
- Columna de categoría profesional.
- Columnas de datos por comarca/categoría.
- Columna de comarcas OSI.
- Columna de categoría profesional.
- Columnas de datos por comarca/categoría.
Preferencia lingüística:
- Columna de comarcas OSI.
- Columnas de datos por comarca.
Se han generado tres nuevas pestañas en el Excel, una para ACREDITACIONES, otra para REQUISITOS y otra para PREFERENCIAS en los que se han ordenado y limpiado los datos, unificando los nombres de OSI, borrando columnas y filas y columnas de totalizados.
Fichero generado: Personal Osakidetza_EDITADO.xlsx
Posteriormente se ha desarrollado un script de Python que en base a estas columnas de Excel, transforma la información y la agrega a un fichero JSON con la siguiente estructura:
{
"NOMBRE_OSI_1": {
"% Euskera": number,
"categorias": [
{
"Categoria Profesional": string,
"TOTAL": number,
"ACRED": {
"SI": number,
"NO": number,
"% SI": number | null,
"% NO": number | null
},
"REQ": {
"SI": number,
"NO": number,
"% SI": number,
"% NO": number
}
}
]
},
"NOMBRE_OSI_2": {
"% Euskera": number,
"categorias": [
// ... más categorías
]
}
}Fichero generado: Personal Osakidetza.json
Se ha generado además un script para comparar los totales de las acreditaciones por comarca/categoría y sus respectivos requisitos, para asegurar que el total a comparar de ambas tablas es coincidente. También se ha creado otro script para extraer las traducciones de las categorías laborales.
Con esta estructura se ha creado una herramienta de análisis de datos. Para ello se han utilizado los siguientes componentes técnicos y la programación de la herramienta se ha realizado con apoyo de modelos de inteligencia artificial.
Componentes técnicos utilizados
Esta herramienta ha sido desarrollada utilizando las siguientes tecnologías:
Repositorio
El código fuente de este proyecto está disponible en: https://gitlab.com/yayitazale/hizkuntzaeskubideakosakidetza