29 mayo 2023

El efecto de ChatGPT en la productividad de los trabajadores

por Santi Garcia

Personalmente pienso que los mayores desafíos que la revolución de la IA generativa planteará en relación con la gestión de personas en las organizaciones no tendrán que ver tanto con la capacidad de esta tecnología para automatizar tareas y procesos de RRHH como con la respuesta que den las empresas ante el incremento de la productividad de sus trabajadores a consecuencia de la adopción de soluciones basadas en esas tecnologías.

En relación con esta cuestión encuentro particularmente interesante un experimento llevado a cabo a principios de este año por dos estudiantes de doctorado del MIT, Shakked Noy y Whitney Zhang, cuyos resultados podemos tomar como una “alerta temprana” de algunos posibles efectos, en ocasiones contraintuitivos, de la irrupción de las tecnologías de IA generativa en el mundo del trabajo.

El objetivo de los autores era analizar cómo ChatGPT impacta en la productividad, habilidades y satisfacción laboral de los trabajadores. Para ello seleccionaron una muestra de 444 participantes, todos ellos con estudios universitarios, con experiencia en áreas como marketing, consultoría, análisis de datos, recursos humanos y gestión de empresas. Cada persona debía realizar dos tareas de escritura relevantes para su ocupación, como redactar comunicados de prensa o correos electrónicos delicados. Estas tareas de 20 a 30 minutos se asemejaban a su trabajo real. Además, se les incentivó con bonificaciones económicas para que produjesen un trabajo de alta calidad. 

La muestra se dividió aleatoriamente en dos grupos: un grupo de tratamiento, al que se le dio acceso a ChatGPT para realizar la segunda tarea, y un grupo de control que no tuvo acceso a esta herramienta.

(Importante: A la hora de valorar los resultados de este experimento debemos tener en cuenta que el documento de trabajo fue publicado el 10 de marzo de 2023, con lo que la versión de ChatGPT que utilizaron los miembros del grupo de tratamiento para hacer las tareas asignadas debió de ser como mucho la basada en el modelo GPT-3.5, significativamente menos potente que la última versión disponible en el momento de escribir esta líneas, basada en el modelo GPT-4, que salió al mercado el 14 de marzo de este año.)

Para medir los resultados de la investigación, se analizaron diversos aspectos, como la productividad (tiempo empleado y calidad del trabajo), la complementariedad entre humanos y máquinas, los cambios en la estructura de las tareas de escritura, la demanda de habilidades y competencias, la satisfacción laboral y la autoeficacia, así como las creencias sobre la automatización. Los trabajos fueron evaluados por profesionales experimentados de las mismas áreas que los participantes, quienes calificaron la calidad general, la calidad de la escritura, la calidad del contenido y su originalidad.

Algunos resultados fueron sorprendentes y podrían tener implicaciones significativas para la forma en que entendemos el papel de la inteligencia artificial en el lugar de trabajo. Esto es, desde mi punto de vista, lo más destacable:

1- ChatGPT mejora significativamente la productividad en tareas de escritura profesionales, aumentando tanto la velocidad como la calidad del trabajo.

El experimento evidenció el potencial de ChatGPT para aumentar la productividad en tareas de escritura profesionales. Los participantes que utilizaron esta herramienta pudieron completar sus tareas un 23% más rápido, y la calidad de su trabajo, evaluada por expertos independientes, aumentó en un 20%. Esto se reflejó en un incremento de 0.45 desviaciones estándar en las calificaciones otorgadas por los evaluadores al grupo que usó la herramienta, observándose mejoras en la calidad general y en aspectos específicos como la escritura, el contenido y la originalidad.

2- Los trabajadores tienden a utilizar ChatGPT como una herramienta de sustitución de esfuerzo humano en lugar de un complemento para amplificar sus capacidades.

El estudio arrojó otro resultado interesante: Los trabajadores en el estudio optaron por utilizar ChatGPT principalmente para automatizar partes de su trabajo y reducir su esfuerzo en vez de como un complemento para potenciar sus habilidades o hacer un trabajo de mayor calidad. En este sentido, da que pensar que el 68% del grupo de tratamiento no editó el resultado inicial generado por ChatGPT antes de entregarlo, y que, en promedio, los participantes se mantuvieron activos en la tarea únicamente tres minutos después de pegar grandes cantidades de texto (generado presumiblemente por la herramienta).

3- El uso de ChatGPT reduce la desigualdad de rendimiento entre los participantes (aunque no beneficia especialmente a aquellos con menos habilidades de escritura) 

El uso de ChatGPT, además, redujo la desigualdad de rendimiento entre los participantes, de manera que aquellas personas que obtuvieron unas calificaciones más bajas en la primera ronda se beneficiaron más del acceso a ChatGPT. Este fenómeno posiblemente tenga que ver con dos factores: 1) que la calidad de los textos que produce ChatGPT es superior a la calidad de los textos que escriben muchos profesionales en sus trabajos; 2) que los profesionales de mejor desempeño utilizan ChatGPT para reducir su esfuerzo más que para hacer un trabajo todavía de mayor calidad.

En relación con esta cuestión, un hallazgo inesperado del estudio fue que aunque, a priori, se podría suponer que ChatGPT sería una herramienta especialmente beneficiosa para quienes tienen mayores dificultades para expresar sus ideas por escrito, el acceso a la herramienta no favoreció en mayor proporción a aquellas personas con menores habilidades de escritura.

Una hipótesis es que ChatGPT contribuye a mejorar las argumentaciones, o incluso la originalidad de los planteamientos de los usuarios, más que su expresión escrita. Otra hipótesis es que una redacción precisa es esencial para formular prompts efectivos a ChatGPT, lo que hace que aquellos con una expresión escrita más pobre no consigan capturar ese beneficio que, teóricamente, podría proporcionarles la herramienta.

4- El acceso a ChatGPT aumenta la satisfacción laboral y la autoeficacia de los participantes (hasta el punto de que están dispuestos a pagar por tener acceso a esta herramienta)

El experimento de Noy y Zhang reveló que el uso de ChatGPT también aumenta la satisfacción laboral de los participantes. Respecto a las causas de esta mejora, aunque un gran número de participantes informaron en una pregunta abierta al final del cuestionario que habían disfrutado descubriendo y trabajando con esta herramienta, es posible que tengan mucho que ver con la capacidad de ChatGPT de automatizar componentes tediosos o molestos de las tareas, y de reducir el tiempo que los usuarios necesitan para completarlas. Otro aspecto sobre el que ChatGPT tuvo un impacto positivo, aunque menos evidente, fue en la autoeficacia de los trabajadores, es decir, su percepción de su propia capacidad para completar tareas y alcanzar metas. Un reflejo de estas valoraciones positivas de los trabajadores es su notable disposición para pagar por el acceso a ChatGPT en sus trabajos. En concreto, los participantes dijeron estar dispuestos a asignar, en promedio, alrededor del 0.5% de su salario mensual para suscribirse a ChatGPT. 

5- La experiencia con ChatGPT puede cambiar las percepciones de los trabajadores sobre la inteligencia artificial

Finalmente, el estudio también arroja luz sobre cómo la experiencia directa con la IA puede remodelar las percepciones de los trabajadores sobre estas tecnologías. Aunque tras probar ChatGPT los trabajadores mostraron una mayor preocupación sobre la posibilidad de que sus roles sean reemplazados por la IA, curiosamente, también se incrementó su optimismo acerca de cómo la IA podría a corto plazo potenciar su productividad en sus roles actuales, y su optimismo general sobre futuros avances en el campo de la IA.

DISCUSIÓN

Según los resultados de este experimento los trabajadores aprovechan los aumentos de productividad que proporcionan soluciones de IA generativa como ChatGPT para ahorrar tiempo y reducir su esfuerzo más que para aumentar la calidad con la que hacen sus tareas (aunque esta también aumenta) o el volumen de output que producen, y esto impacta positivamente en su satisfacción laboral, su autoeficacia, y en el optimismo con que contemplan los avances presentes y futuros en el campo de la inteligencia artificial…

Ahora veremos qué pasa cuando se enteren sus jefes… ;-)

Bromas aparte, es importante que tengamos en cuenta que no se trata de datos aislados. Los resultados del experimento de Noy y Zhang con ChatGPT coinciden con los de estudios realizados entre usuarios de otras soluciones de IA generativa, como Copilot, una herramienta de desarrollo automático de código informático desarrollada por GitHub. Según leemos en el 2023 AI Index Report de la Universidad de Stanford, los aspectos que más valoraban los usuarios de esta herramienta en septiembre de 2022 era la mayor rapidez con que les permitía hacer tareas repetitivas, la mayor rapidez con que completaban sus asignaciones, el menor esfuerzo mental que tenían que hacer para llevar a cabo esas tareas repetitivas, o el menor tiempo que tenían que dedicar a buscar referencias.

Unos datos que también concuerdan con los de un reciente estudio de Microsoft, según el cual, aunque el 49% de las personas se muestra preocupado por que la IA reemplace sus trabajos, un 70% estaría dispuesto a delegar la mayor cantidad de tareas posible a la IA para reducir su carga de trabajo. Por otro lado, cuando se les pidió a los participantes que imaginaran su trabajo ideal en 2030, lo que valoraron principalmente fueron cosas como producir un trabajo de alta calidad en la mitad del tiempo, aprender nuevas habilidades el doble de rápido, comprender mejor cómo emplear su tiempo y energía de manera eficaz, no tener que asimilar información innecesaria o irrelevante, o reducir a la mitad el tiempo invertido en reuniones y en responder correos electrónicos y mensajes de chat. En otras palabras, lo que más valoran las personas son aquellas mejoras que les ahorran tiempo y esfuerzo mental.

¿A qué se puede deber esto?

El informe de Microsoft al que antes hacía referencia nos da una pista. Según este informe, en España el 60% de las personas dice tener serios problemas para conseguir tiempo y energía suficientes para sacar adelante su trabajo y estas personas, además, son 4,9 veces más propensas a afirmar que tienen dificultades con la innovación y el pensamiento estratégico. 

Es posible que todo esto tenga que ver con la “deuda digital” de la que recientemente hablaba Satya Nadella. “Todos estamos cargando con una deuda digital: el flujo de datos, correos electrónicos, reuniones y notificaciones ha superado la capacidad humana para procesarla toda. Y el ritmo de trabajo solo está intensificándose. Todo parece importante, por lo que pasamos nuestros días laborales intentando poner al día nuestras tareas. Solo hay una cantidad de minutos en el día, y cada minuto que dedicamos a gestionar esta deuda digital es un minuto que no se dedica al trabajo creativo que conduce a la innovación. En un mundo donde la creatividad es la nueva productividad, la deuda digital es más que una molestia, está afectando a los resultados de los negocios.”

También puede tener que ver con la gran cantidad de trabajo absurdo y de cero valor añadido que se genera en muchas organizaciones, a veces con el único fin de justificar la existencia de unas estructuras jerárquicas igualmente absurdas. Antes mencionábamos la gran cantidad de personas que en España tienen dificultades con la innovación por los problemas que tienen para conseguir el tiempo y la energía suficientes para sacar adelante su trabajo. Ahora podríamos contarles a esas personas que, según el mismo informe, el 60% de los líderes de las empresas españolas se muestran preocupados por la falta de innovación en sus organizaciones. A ver qué opinan.

Personalmente, me da la sensación de que la llegada de que la revolución de la inteligencia artificial generativa puede provocar un serio agravamiento de la “paranoia de la productividad” sobre la que ya hemos hablado en anteriores ocasiones. La diferencia es que en esta ocasión el “teatro de la productividad” que muchos managers afectados por ese mal provocaron entre sus colaboradores cuando les hicieron regresar a la oficina después de la pandemia, o les sometieron a sistemas de monitorización online de su trabajo, será todavía más difícil de detectar. 

Además, debemos tener en cuenta que, por lo que estamos viendo, si no hacemos nada diferente estas herramientas no van a mejorar el desempeño de las personas que ya hacen un buen trabajo sino, sobre todo, el de las personas menos productivas. Podemos pensar que ya solo con esto mejorará el desempeño del conjunto de la organización, pero hay un nuevo problema. La realidad es que el trabajo de los empleados de peor desempeño mejorará, sí, pero probablemente solo para igualarse con un estándar al que ahora va a poder acceder todo el mundo y, por tanto, no nos va a hacer diferentes de nuestros competidores.

CONCLUSIÓN

Herramientas como ChatGPT pueden ser herramientas poderosas para aumentar la productividad y la satisfacción laboral, pero también plantean nuevos desafíos y preguntas. ¿Cómo podemos garantizar que estas tecnologías se utilicen para potenciar y no para reemplazar el esfuerzo humano? ¿Cómo se pueden utilizar estas herramientas para impulsar la creatividad y la innovación, en lugar de simplemente automatizar tareas? ¿Cómo pueden los líderes y los profesionales de recursos humanos gestionar el impacto de estas tecnologías sobre la distribución del rendimiento de las personas y la percepción del valor del trabajo?

Asimismo, no debemos pasar por alto la importancia de abordar temas como esa «deuda digital» que amenaza con desbordarnos y que en algunas ocasiones es consecuencia de esa «paranoia de la productividad» que todavía sufren demasiados jefes. Al mismo tiempo, las organizaciones necesitan abordar las estructuras y prácticas de trabajo obsoletas y de escaso valor añadido que agotan la energía y el tiempo de sus personas. En lugar de añadir más presión a los trabajadores para que sean más productivos, necesitamos replantearnos el significado que damos en nuestras organizaciones al término “productividad” y crear entornos en los que las personas puedan hacer un trabajo significativo y creativo.

En conclusión, la inteligencia artificial generativa tiene el potencial de ser una gran aliada en este proceso, pero también podría agravar los problemas si no se maneja de manera consciente y estratégica. Quizás deberíamos empezar por pensar en cómo queremos que sea el trabajo en la era de la IA generativa en nuestras organizaciones y qué necesitamos cambiar para que eso sea posible.

REFERENCIAS

Noy, S., & Zhang, W. (2023). Experimental evidence on the productivity effects of generative artificial intelligence. Available at SSRN 4375283.

Microsoft. (2023). Will AI Fix Work? 2023 World Trend Index.

Stanford Institute for Human-Centered Artificial Intelligence. (2023). Artificial Intelligence Index.

***

Imagen Joel Dueck bajo licencia Creative Commons