Visualfy entrevista en exclusiva a Vinton Cerf, Vicepresidente y Chief Evangelist de Google y uno de los ‘padres de Internet’.
María José Millán (CSO en Visualfy) : Es un honor recibir hoy en Visualfy a Vinton Cerf, Vicepresidente y Chief Internet Evangelist de Google. Vinton es uno de los padres de Internet, como probablemente ya sabéis, y también el fundador del movimiento internacional de agentes del cambio ‘People Centered Internet’, creado para asegurar que internet continúe siendo una fuerza para mejorar las vidas de las personas.
Buenos días Vinton. Es un placer para Visualfy tenerte aquí. Gracias por esta gran oportunidad de compartir tiempo contigo, y por ayudarnos a recordar a los jóvenes con pérdida auditiva que pueden llegar a ser lo que se propongan, incluso el Vicepresidente de Google.
Yo soy María José Millán y me encargo del departamento de Marketing en Visualfy. Conmigo está Manel Alcaide, fundador de Visualfy. Como sabes somos una startup formada por personas sordas y oyentes, y creamos tecnología para personas con pérdida auditiva y compañías comprometidas con la accesibilidad.
Manel Alcaide (CEO de Visualfy): Hola Vinton, estamos encantados de tenerte con nosotros. Estamos deseando conocerte mejor, así que comenzamos con la entrevista. Como hemos mencionado, eres uno de los padres de Internet. Viendo lo que internet significa hoy en día para millones de personas, ¿imaginabas un éxito tan masivo por aquel entonces?
Vinton Cerf: Bueno, creo que allá por 1970 cuando Robert Khan y yo hicimos el diseño original estábamos centrados en resolver el problema que nos había planteado el departamento de defensa americano, que era cómo hacer posible que se comunicaran una serie de ordenadores conectados. Estábamos centrados en un problema de ingeniería, pero ya estaba bastante claro, incluso en el sistema predecesor de internet, llamado ARPANET, que era un test para ver si podíamos conectar diferentes marcas de ordenadores entre sí en una red homogénea. Estaba muy claro para los ingenieros que estaban trabajando en esto que, además de su potencial técnico, tenía implicaciones sociales. Creamos el email electrónico, listas de email y teníamos personas conversando acerca de quienes eran los mejores escritores de ciencia ficción o dónde estaban los mejores restaurantes.
Entonces, era evidente ya cuando Internet estaba siendo diseñado y construido, que había un fuerte componente social en todo ello, y que también tenía implicaciones para las personas con discapacidad auditiva, porque mucha de la comunicación que hay en internet es texto, es escrita. Por email o chat y cosas así. Entonces, desde mi punto de vista, como persona con pérdida auditiva, una red con una forma de comunicación alternativa era realmente bienvenida, así que sí, pude intuirlo desde el principio.
"Era evidente ya cuando Internet estaba siendo diseñado y construido, que había un fuerte componente social en todo ello, y que también tenía implicaciones para las personas con discapacidad auditiva", Vinton Cerf. Clic para tuitearSin embargo, que se convirtiera en un sistema global a gran escala no estaba asegurado. He de decir que cuando estábamos haciendo el diseño anticipamos que debía ser lo suficientemente global para su aplicación militar, porque el departamento de defensa tenía que poder operar desde cualquier parte del mundo. De algún modo esta globalidad formó parte del diseño original, pero el hecho de tener a cerca de cuatro millones de personas online fue una evolución derivada del uso en una variedad de sectores públicos y privados. Nada de esto podría haber tenido la escala que tiene ahora sin esta evolución por el uso. La motivación e inversión privada vino más tarde, a finales de los 80 y principios de los 90. Particularmente, Tim Berneers Lee y la ‘World Wide Web’ emergieron de esta confluencia de innovación.
MJ.: Ahora mismo eres Vicepresidente y Chief Internet Evangelist de Google. Tenemos curiosidad, ¿cómo es un día en la vida de un Chief Internet Evangelist? ¿Cuál es tu cometido?
V.: Un ejemplo de las cosas que hago son entrevistas como esta por internet. Lo cierto es que con mucha frecuencia estoy haciendo pequeños videos y cosas así, que envío a conferencias que no puedo atender en persona. Parte de mi trabajo es estar presente en diferentes acontecimientos, a veces en persona y a veces a distancia. De hecho estaré en Barcelona en un par de días para celebrar un premio del gobierno de Cataluña. De modo que viajo mucho, aproximadamente un 80% de mi tiempo. A veces voy a lugares donde no hay internet para animar a la gente a construir la infraestructura necesaria.
Empleo una significativa parte de mi tiempo en políticas asociadas con Internet, en estudiar el impacto social de Internet, cómo hacer frente a los comportamientos negativos que vemos o los beneficios positivos de Internet: aportaciones como el comercio electrónico, nuevos perfiles profesionales que están siendo creados, nuevos negocios a partir de la infraestructura que constituye Internet. Llevo a cabo un rol político en este sentido. Y como estoy en Google, que es una gran compañía tecnológica, empleo mucho de mi tiempo en tareas técnicas, intentado entender como mejorar el funcionamiento del sistema, qué cosas nuevas podemos hacer y particularmente en Google, dónde seguimos expandiendo el portfolio de productos y servicios que ofrecemos, estamos en el negocio del hardware, creamos móviles, Google Homes, aparatos y todo tipo de dispositivos IoT. No me imagino un trabajo más divertido que el que tengo, porque debo prestar atención a muchas cosas diferentes que están asociadas con Internet.
M.: Miles de personas con pérdida auditiva alrededor del mundo sueñan con desarrollar sus carreras en tecnología, pero todavía encuentran barreras debido a la falta de accesibilidad. ¿Qué les recomendarías?
V.: La accesibilidad es un término muy importante y deberíamos utilizarlo del modo más amplio posible. Tenemos posiblemente el dispositivo más flexible jamás inventado, el ordenador. Puede hacer cualquier cosa que le programemos para hacer. Así que no hay límites más allá de los de nuestra imaginación y nuestra habilidad para crear software. A pesar de ello, constatamos que las aplicaciones disponibles en nuestros ordenadores portátiles o de escritorio, móviles o tabletas, no son muy satisfactorias en lo que concierne a la accesibilidad. Y no estoy satisfecho de ello.
Resulta que no es tan fácil diseñar, averiguar como crear una aplicación que sea o pueda ser accesible para una persona con algún nivel de pérdida de visión, de pérdida auditiva, de movilidad o cognitiva. Como diseñador de una aplicación tienes que pensar, desde el principio, en la fase de diseño, como hacerlo accesible para todo el mundo. Entonces, ¿cómo diseño una aplicación que se pueda adaptar a todos los casos de uso que son necesarias para la accesibilidad?. No todo el mundo que está diseñando y programando tiene intuición para hacer este tipo de diseño. Entonces estamos realmente fallando ahí por una falta de comprensión profunda sobre las prácticas y técnicas necesarias para hacer las cosas accesibles.
Hay una tendencia a diseñar y construir un servicio o producto, y después intentar superponer la accesibilidad a posteriori. Un ejemplo de esto serían los lectores de pantallas que pueden entender html de la web e intentar traducir a voz lo que hay en la pantalla. Yo pienso que el resultado es muy insatisfactorio desde muchos aspectos, porque los diseñadores de las páginas web que después se transforman en voz no pensaron cómo presentar esta información en dos dimensiones en forma seriada. Si se trata voz, puedes hacer lo que quieras.
"Constatamos que las aplicaciones disponibles en nuestros ordenadores portátiles o de escritorio, móviles o tabletas, no son muy satisfactorias en lo que concierne a la accesibilidad. Y no estoy satisfecho de ello", Vinton Cerf. Clic para tuitearSoy un gran fan de investigar profundamente para conseguir insights para hacer las cosas accesibles, pero al mismo tiempo estoy bastante animado por la flexibilidad de los dispositivos programables para adaptarlos a las necesidades de las personas. Necesitamos trabajar duro para construir marcos de accesibilidad que incluyan a los usuarios para hacer estos tipos de adaptaciones.
Todavía tenemos un largo camino por recorrer. Yo soy un defensor férreo de este tema en Google y lo continuaré siendo. Estoy satisfecho de que hayamos encontrado el camino para hacer un buen trabajo haciendo nuestros productos accesibles. [
MJ: ¿No piensas que necesitamos personas sordas y con pérdida auditiva en los equipos para conseguir entender como hacer nuestros productos accesibles? Porque las personas sordas y con pérdida auditiva, por lo menos aquí en España, tienden a no estudiar desarrollo de software o ciencias informáticas porque piensan que no van a terminar trabajando en el sector. Nosotros intentamos animarles a hacerlo, ya que les necesitamos para desarrollar nuevos productos.
Tengo dos ejemplos para vosotros, sobre los que quiero que las personas con las que trabajáis piensen. Hay dos personas sordas en Google con las que trabajo. Una de ellas es Ken Harrenstien. Es sordo y signante. Este chico trabajó muy duro para incluir subtítulos en los vídeos de Youtube, la subtitulación automática. Además de esto, creó una manera de descargar los subtítulos que han sido generados por el ordenador, y después corregir los errores y volver a subirlos, de forma que puedas tener subtítulos de calidad. Un chico sordo hizo ese esfuerzo y yo creo que tiene mucho sentido que fuera él.
El segundo chico es Dimitri Kanevsky. Dimitri nació sordo, habla ruso. Ahora es uno de nuestros empleados y habla inglés también, pero tiene un acento muy fuerte. Él ha desarrollado subtítulos automáticos en muchas aplicaciones. Pero la primera es una aplicación que funciona en tu móvil, capta lo que oye y después lo muestra en texto en el móvil, haciendo scroll hacia abajo. Él lo hizo porque lo necesitaba en las reuniones y conferencias en las que no podía oír y necesitaba tener conversaciones con otras personas. Funciona en, no sé, 40 o 50 idiomas diferentes. Puedes elegir un idioma primario y otro secundario, y cambiar de uno a otro entre ellos.
Esta es una bonita aplicación, pero una aplicación incluso más emocionante que tenemos es una de video conferencias, a la que llamamos Google Meets, y en su sistema ahora tenemos la posibilidad de crear subtítulos automáticos de lo que cada uno está diciendo en la conferencia.
Entonces, si tenemos un grupo de personas diferentes todo lo que cada una de ellas dice aparece subtitulado al final de la pantalla, automáticamente, en el sistema de Google Meets. Esta nueva tecnología es cada vez mejor gracias a la habilidad del machine learning (aprendizaje automático) para entender y reconocer la voz. La tecnología del machine learning ha avanzado drásticamente en la última década, hasta el punto de que ahora podemos hacer un buen trabajo entendiendo la voz, y por supuesto generándola. Así que tenemos dispositivos, como Google Home, que pueden hablar. Ahora necesitamos tener estos mismos dispositivos subtitulen las respuestas que dan, de forma de que tengamos además de un altavoz inteligente una pantalla o componente en el dispositivo de Google Home que pueda responder en texto.
MJ.: Nos alegramos de oír eso. Vinton, todos hemos leído sobre tu historia de amor, la historia de tu mujer. Ella nació sorda y fue capaz de escuchar después de un implante coclear a los 53 años. ¿Cómo ha impactado la tecnología tu vida y cómo piensas que está mejorando la vida de las personas con discapacidad? ¿Crees que es una fuerza para mejorar el mundo?
V.: si, soy un gran fan de la tecnología. No estaría donde estoy si no lo fuera. Solo una pequeña aclaración. Mi mujer Sigrid nació oyente, pero perdió la audición cuando tenía tres años debido a una meningitis espinal. La razón por la que esto es importante es porque ella era lo que se llama “sorda postlocutiva”. Ella podía oír, podía hablar, tenía memoria auditiva. Esto es importante porque cuando finalmente le hicieron el implante 50 años después, su cerebro no había olvidado su aprendizaje auditivo y rápidamente se adaptó al funcionamiento de los implantes. A los 20 minutos de ponerlos en marcha, de activarlos por primera vez, pudo coger el teléfono y hablamos por teléfono por primera vez en nuestros 30 años de matrimonio.
Posteriormente le hicieron un segundo implante, 10 años más tarde, y después recientemente uno de los implantes falló, y después tuvimos otro re-implante, que también ha tenido éxito.
Otra cosa que está ocurriendo es que la tecnología de procesamiento de voz que va con los implantes cocleares ha mejorado a lo largo del tiempo, así que vemos su oído derecho funcionando mejor que nunca porque tenemos nuevos procesadores de sonido.
Así que te puedes imaginar que soy un gran fan de la tecnología que aumenta la capacidad humana, que no solo la acerca a lo establecido como “normal”, sino que va más allá y sobrepasa las capacidades humanas habituales. Así que no necesitamos parar cuando alcancemos el funcionamiento normal de las capacidades humanas. Piensa por tan solo un minuto como sería ser capaz de escuchar lo que los perros escuchan a 20.000 herzios por segundo, quizá no queremos hacerlo, pero podemos hacerlo.. o ver con Rayos X o con infrarrojos o luz ultravioleta, mejorar nuestra visión no solo para corregir la ceguera sino incluso para ver como con un microscopio.
Así que me entusiasman la electrónica y las interfaces neuronales que nos permiten aportar nuevas capacidades al intelecto humano. Me gustaría profundizar un poco en este tema, porque un par de investigadores muy importantes en la historia JCR Licklider y Douglas Engelbart estaban convencidos en 1950 de que el ordenador podría ser usado para aumentar el intelecto humano y donde quiera que hagas un búsqueda en Google hoy, donde sea que estés utilizando Google Translate, donde quiera que estés viendo un video y viendo subtítulos automáticos, estás utilizando inteligencia artificial, estás utilizando una capacidad informática para aumentar tu propia capacidad.
En Google vemos todas estas cosas como herramientas para mejorar nuestras propias habilidades para hacer cosas que no podríamos hacer solo con nuestras capacidades. Me emociona todo este potencial, pero tengo que decir que también me preocupa que nos convirtamos en dependientes de estas tecnologías o que se vuelvan en nuestra contra.
"Soy un gran fan de la tecnología que aumenta la capacidad humana, que no solo la acerca a lo establecido como “normal”, sino que va más allá y sobrepasa las capacidades humanas habituales", Vinton Cerf. Clic para tuitearEn el mundo de internet, por ejemplo, especialmente en las redes sociales, puedes ver como una persona utiliza ordenadores y redes de bots, por ejemplo, para impulsar su punto de vista particular para que parezca que diez mil personas piensan como ella. Este es un tipo de desinformación aumentada, lo cual es perjudicial, por no hablar de los ataques informáticos o los ataques de virus y este tipo de cosas.
Así que terminamos dándonos cuenta de que la tecnología es una navaja de doble filo, y que se puede abusar de ella. Además de imaginar posibles maneras en que la tecnologías puede mejorar nuestras vidas, tenemos que ocuparnos también de personas que intentan utilizar la tecnología para hacer daño. Así que ese es el gran reto, es un reto social y económico al que debemos enfrentarnos, y no todo solucionable únicamente con la tecnología.
Mj: Ya hemos hablado de eso pero, conociendo el potencial de internet para ayudar a las personas, ¿crees que hay compañías que deberían centrarse en hacer sus tecnologías accesibles para todo el mundo?
V.: Si, estás intentando convencer al convencido. Creo que las compañías que ofrecen productos y servicios deberían estar pensando en todo el rango de necesidades de la población del planeta, entre la que se incluyen las de las personas con discapacidad.
Permitidme matizar mi respuesta. Ambos sabéis que las discapacidades son de muy diferentes tipos, por decirlo de alguna manera. La sordera varía de ser tratable con un audífono o amplificador a necesitar un implante coclear. Podemos utilizar el mismo argumento para las diferentes formas de pérdida de visión. Es como que no todos los productos se pueden adaptar a las necesidades de cada forma de discapacidad, especialmente en los casos más extremos.
Entonces, la pregunta es: ¿qué hacemos al respecto? Y una posible respuesta sería diseñar y construir productos que tengan interfaces estandarizadas, de modo que si tenemos o necesitamos construir un dispositivo que sea específico para un uso particular con discapacidad podríamos hacerlo, para después usar interfaces estandarizadas para manejar y controlar la aplicación. La estandarización sería nuestra aliada aquí donde utilizamos un dispositivo especializado para nuestras necesidades y después las interfaces también, como una aplicación.
Así que veo responsabilidades que van desde el que crea el producto, que debe hacer todo lo posible por hacerlo accesible y estandarizar sus interfaces, para permitir que otra persona u otra compañía pueda aportar una capacidad o funcionalidad todavía más adaptada a las necesidades de usuarios específicos. Pero deberíamos incorporar todo ese pensamiento en nuestro desarrollo de producto.
MJ: Entre todos los proyectos que Google tiene en marcha, ¿hay alguno que esté enfocado en las tecnologías accesibles para personas con pérdida auditiva? Has mencionado el subtitulado… ¿Podrías contarnos sobre este tipo de proyectos? ¿Hay algunos proyectos sobre los que nos puedas contar?
V.:bueno, dentro de la compañía hemos establecido lo que llamamos “índices de accesibilidad” de Google, ya sabéis, del 1 al 4. E intentamos construir nuestros productos para que tengan la máxima accesibilidad posible. Todavía tenemos mucho camino por recorrer para entender como hacerlo bien, pero es algo a lo que se está prestando muchísima atención dentro de la compañía.
Tenemos una unidad central dedicada a la accesibilidad. En ella están representadas todas las áreas de producto en las que está trabajando Google, de manera que podamos ayudar a mejorar la implementación de mecanismos de accesibilidad en todas ellas.
"Creo que las compañías que ofrecen productos y servicios deberían estar pensando en todo el rango de necesidades de la población del planeta, entre la que se incluyen las de las personas con discapacidad", Vinton Cerf. Clic para tuitearPara las personas con pérdida auditiva creo que hemos impulsado bastante la tecnología de reconocimiento de voz automático, pero queremos abarcar un rango mucho más amplio de discapacidades a parte de la auditiva. Y continuamos trabajando por supuesto para que nuestros productos sean más accesibles para personas con pérdida auditiva.
En algún momento, por ejemplo, deberíamos poder ser capaces de crear un sistema de traducción de idiomas de forma visual. Así, si una persona está hablando ruso y otra persona está hablando Inglés ambas podrían ver en texto el significado de lo que está diciendo la otra en el idioma elegido. Un buen ejemplo sería que dos personas sordas, hablando dos idiomas diferentes, se puedan comunicar porque sus móviles están haciendo la traducción y presentándola en la conversación. Me entusiasma ser capaz de ayudar a la gente a superar esa barrera.
Manel: La tecnología avanza muy rápido y está cambiando la forma en que lo hacemos todo. Para ti, ¿Cuál ha sido el avance tecnológico más grande en los últimos diez años y cómo piensas que la tecnología mejorará la accesibilidad proximamente?
V.: Pienso que probablemente la tecnología que está cobrando más relevancia es el ‘machine learning’ (aprendizaje automático). La habilidad de construir redes neuronales de multi aprendizaje que puedan adaptarse a aplicaciones que incluyen comprensión, reconocimiento o traducción de voz.
Todos los tipos de reconocimiento de imagen, por ejemplo, navegación para ayudar a las personas ciegas a saber qué está pasando, qué hay a su alrededor, conocimiento de tu ubicación, cosas así. Los coches autónomos hacen un uso intensivo del machine learning (aprendizaje automático) junto con la Inteligencia Artificial. Así que ha habido un desarrollo informático muy considerable en las últimas décadas.
Mirando hacia el futuro, una de las cosas que cada vez estamos más capacitados para hacer es crear dispositivos informáticos conectados a nuestro sistema neuronal. El implante coclear es un buen ejemplo de este tipo de interfaz neuronal electrónica. Estamos viendo dispositivos ópticos de este tipo, que almacenan la visión, y motores sensoriales para personas que han perdido el control de sus brazos y piernas por una lesión en la médula espinal, con formas de propagar las señales neuronales a través de un dispositivo recuperando así el control sobre las extremidades. Contamos ya con trabajos extraordinarios para ayudar a personas que perdieron sus extremidades, en los que se utilizan interfaces neuronales, en contraposición a las mecánicas, para controlar las extremidades artificiales.
Me entusiasman las redes neuronales y las capacidades motoras sensoriales que se desarrollarán en un futuro cercano. Mirando hacia un futuro más lejano, y siendo mucho más especulativos, entrevemos la posibilidad de crear interfaces que conecten dispositivos informáticos con nuestros cerebros.
"Mirando hacia el futuro, una de las cosas que cada vez estamos más capacitados para hacer es crear dispositivos informáticos conectados a nuestro sistema neuronal", Vinton Cerf. Clic para tuitearConforme me hago mayor me doy cuenta de que me olvido más de las cosas, así que lo que necesito es una memoria aumentada y espero algún día tener un pequeño implante de memoria. Creo que este tipo de interfaz cognitiva es extremadamente especulativa, muy de ciencia ficción ahora mismo, porque realmente no entendemos cómo almacena el cerebro la memoria y cómo podemos hacerlo de manera consciente en una memoria externa, y como recuperar luego lo que queremos fijando nuestra atención en ella. Otra forma de hacerlo es almacenándola en un ordenador o haciendo una búsqueda por Google, de hecho esta es mi forma de recuperar la memoria perdida. Esto es muy especulativo, se dará en un futuro mucho más lejano, pero no está fuera del rango de posibilidades dado lo mucho que hemos aprendido en los últimos 50 o 100 años acerca de cómo funciona el cuerpo humano.
MJ: Hablando del reconocimiento de imagen, en Visualfy trabajamos con personas con todo tipo de pérdida auditiva y, como sabes, algunos de ellos utilizan lengua de signos para comunicarse. Estamos muy preocupados porque todas las voces generadas en los dispositivos tengan en cuenta a las personas que no pueden escuchar la voz. ¿Tienes algún proyecto que esté referido al reconocimiento de voz?
V.: ahora mismo tenemos dos cosas en marcha. Por un lado estamos, junto con otras iniciativas, explorando si es posible el reconocimiento de la lengua de signos a través del reconocimiento de imágenes. Requiere video en muy alta calidad que funcione fluidamente, sin interrupciones, porque es necesario ver movimientos muy rápidos. Yo no soy signante pero veo a personas signando y me impresiona lo rápido que son capaces de comunicarse utilizando la lengua de signos, por lo que estamos todavía algo lejos de poder hacer esto de una forma fiable.
Normalmente se termina resolviendo llevando un guante o algún tipo de prenda pre-configurable en el brazo. Microsoft por ejemplo tiene uno, no recuerdo su nombre… pero hay algunos dispositivos que pueden detectar la posición del cuerpo. Pero creo que no funcionan lo suficientemente rápido como para hacer un buen trabajo signando.
Hay otra cosa interesante destinada a las personas que han nacido sordas o tienen dificultades para hablar, cuyo habla es difícil de entender. Nos hemos preocupado por entrenar nuestro modelo de aprendizaje automático para que entienda este particular tipo de voz de una persona sorda y adaptarla a una voz habitual. De modo que quizás ayude a alguien cuya habilidad para articular esté de alguna forma afectada, y le permita una mayor calidad del discurso, utilizando el aprendizaje automático y un generador de voz. Este es otro ejemplo de aplicación para facilitar la comunicación con el público en general.
Vinton se despide de Visualfy…
Bueno, espero que tengáis éxito con vuestro esfuerzo. Por supuesto yo soy un gran fan de todos estos programas de investigación y espero que podamos producir cosas nuevas que mejoren las vidas de las personas con pérdida auditiva.
Muchas gracias por dejarme unirme a vosotros hoy. Lo aprecio realmente y, por supuesto, me encantará reforzar vuestro mensaje, que la tecnología puede ayudar y que tan solo necesitamos enfocar nuestras mentes para hacerlo posible.