Metodología

Esta página ha sido creada como herramienta para el análisis de datos del proyecto "Derechos lingüísticos en la atención sanitaria vasca" de Euskera Denontzat. Esta colaboración nace del Medialab Tabakalera organizado por Taller datos para la acción y mediado por Estudio Montera34

El proyecto quiere analizar los medios y los trabajadores bilingües necesarios por cada comarca, para garantizar los derechos lingüísticos en Osakidetza.

Objetivos

Racionalizar el debate sobre derechos lingüísticos y laborales, basándolo en datos.

Metodología

Acreditaciones y requisitos de Euskera del Personal de Osakidetza

Origen: Gobierno Vasco

Enlace externo: https://www.legebiltzarra.eus/ords/f?p=120:18:5739858556038::NO:RP,RIR:P18_ID,P18_EXPAND:85998,N

Documento original: 250401083850131002.xlsx

Fecha de publicación: 27 de marzo de 2025

Consultado: 14 noviembre 2025

Preferencias lingüísticas de usuarios de Osakidetza

Origen: Gobierno Vasco

Enlace: https://www.legebiltzarra.eus/ords/f?p=CTP:INICIATIVA_DETALLE:1557042628522::NO:RP:P18_ID,P18_EXPAND:86583,N&p_lang=es

Documento original: 20250530_3481_2_Stamped.pdf

Fecha de publicación: 2 de junio de 2025

Consultado: 14 noviembre 2025

Zonificación geográfica

Origen: EuskalGeo / Gaindegia

Zonificación administrativa: https://www.euskalgeo.eus/eu/deskargak/zonifikazio-administratiboa

Archivo GeoJSON procesado: osis-puestos-2025_simply.json

Listado OSIs

Origen: Gobierno Vasco

Listado OSIs: listado_osis.pdf

Fecha de publicación: septiembre de 2016

Estos datos han sido procesados para obtener la estructura necesaria para crear esta herramienta.

Procesado de datos

En el análisis inicial se han identificado la siguiente estructura de datos según dataset:

Personal osakidetza (XLSX):

Tabla de acreditaciones.

Comarcas OSI.
Acreditados Si/No por comarca.
Categoría profesional
Acreditados Si/No por comarca/categoría.

Tabla de requisitos.

Comarcas OSI.
Requisitos Si/No por comarca/categoría.
Categoría profesional.
Requisitos Si/No por comarca/categoría.

Preferencia lingüística (PDF):

Tabla de preferencias lingüísticas.

Columna de comarcas OSI.

Columnas de datos por comarca.
- Datos totalizados por comarca.
- Datos de preferencias por género y pacientes pediátricos y adultos.

Los datos de las tablas del "Personal osakidetza" son tablas dinámicas incrustadas que solo son accesibles a través de Microsoft Excel. Utilizando dicha herramienta se han transformado los datos para generar un dataset con la siguiente estructura de denominadores comunes:

Personal osakidetza:

Tabla de acreditaciones.

Columna de comarcas OSI.
Columna de categoría profesional.
Columnas de datos por comarca/categoría.

Tabla de requisitos.

Columna de comarcas OSI.
Columna de categoría profesional.
Columnas de datos por comarca/categoría.

Preferencia lingüística:

Tabla de preferencias lingüísticas.

Columna de comarcas OSI.
Columnas de datos por comarca.

Se han generado tres nuevas pestañas en el Excel, una para ACREDITACIONES, otra para REQUISITOS y otra para PREFERENCIAS en los que se han ordenado y limpiado los datos, unificando los nombres de OSI, borrando columnas y filas y columnas de totalizados.

Fichero generado: Personal Osakidetza_EDITADO.xlsx

Posteriormente se ha desarrollado un script de Python que en base a estas columnas de Excel, transforma la información y la agrega a un fichero JSON con la siguiente estructura:

JSON

{
  "NOMBRE_OSI_1": {
    "% Euskera": number,
    "categorias": [
      {
        "Categoria Profesional": string,
        "TOTAL": number,
        "ACRED": {
          "SI": number,
          "NO": number,
          "% SI": number | null,
          "% NO": number | null
        },
        "REQ": {
          "SI": number,
          "NO": number,
          "% SI": number,
          "% NO": number
        }
      }
    ]
  },
  "NOMBRE_OSI_2": {
    "% Euskera": number,
    "categorias": [
      // ... más categorías
    ]
  }
}

Fichero generado: Personal Osakidetza.json

Se ha generado además un script para comparar los totales de las acreditaciones por comarca/categoría y sus respectivos requisitos, para asegurar que el total a comparar de ambas tablas es coincidente. También se ha creado otro script para extraer las traducciones de las categorías laborales.

Con esta estructura se ha creado una herramienta de análisis de datos. Para ello se han utilizado los siguientes componentes técnicos y la programación de la herramienta se ha realizado con apoyo de modelos de inteligencia artificial.

Componentes técnicos utilizados

Esta herramienta ha sido desarrollada utilizando las siguientes tecnologías:

Repositorio

El código fuente de este proyecto está disponible en: https://gitlab.com/yayitazale/hizkuntzaeskubideakosakidetza