Reciclar un viejo DVD en un potente amplificador de audio 2.1

veremos como podemos recicla run un viejo lector de DVD en un estupendo amplificador de audio idal para nuestro ordenador


Cuando se trata de reciclar  de  componentes electrónicos lo cierto es que es mejor respetar al máximo la configuración inicial pues es al fin al cabo el propósito del equipo  y el que normalmente aprovechará su máximo potencial.

En el caso de un equipo irreparable, bien por coste o simplemente por falta de suerte para hacerlo, hay tres elementos valiosos que podemos casi siempre utilizar para nuestros propósitos: la caja , la alimentación de ca  y la fuente de alimentación,  partes que justo usaremos  en este proyecto para implementar un amplificador 2.1 usando estas partes.

 

IMG_20180829_232535[1]

 

En efecto,, aunque parezca increíble,  una vez hayamos desmontado la electronica del viejo lector de dvd  respetando, la parte ca  así como  la fuente de alimentación , es  posible  hoy en día construirse por uno mismo un potente amplificador de audio 2.1   por  muy poco dinero (12€)  ,  con la ventaja de que incluso gran parte de la electrónica ya estará montada y probada, de modo que  sólo necesitaremos hacer las conexiones de  alimentación,   así como cablear los conectores de entrada /salida y ya tendremos el amplificador listo.

En esta ocasión ,vamos a ver un amplificador 2.1  de la que hablamos en otro post   que cuesta unos 12€ en Amazon   en el que que básicamente   solo hay que alimentar  con  corriente continua DC entre  12-24 V   con una fuente conmutada y  conectar tanto la entrada de audio como las tres salidas a sendos altavoces.

La potencia de salida de los canales  izquierda y derecha es 50WX2 (max) y la salida de subwoofer de 100 w (max), la eficiencia puede llegar por encima de 90%.

Los canales izquierdo y derecho de rango completo, con 24 v tensión de alimentación pueden  conducir altavoces de 3-16 ohmios (es decir  una gama muy amplia) y en el caso del  subwoofer si se alimenta el montaje con 24 v  puede conducir un subwoofer, único de  impedancia  entre 2-16 ohm  teniendo en cuenta que a menor impedancia de los altavoces podremos conseguir una mayor potencia de salida.

Las características de este modulo son:

  •  Tensión de alimentación: DC  12-24 V
  • Chip: TPA3116 *
  • Tipo 2 Cadena de 3: Channels (canal derecha, canal derecha, subwoofer)
  • Potencia de salida: 50 *1 *2 RMS subwoofer    sobre  8 ohmios
  • Gama respuesta en frecuencia: 14-100 KHz
  • SNR 100dB de frecuencia: conmutación: 1,2 MHz
  • Tamaño PCB  100 cm *70 *%2F 30 mm **3,94 2,75 1,18in (la + W H)
    1 *2,1 canales bordo de amplificador de audio

Es interesante destacar que para alimentar este amplificador debemos usar un fuente conmutada entre 12 y 24V DC  de unos 18Amp   dada la gran intensidad necesaria,  pues sería mucho mas costoso, voluminoso e ineficiente  cubrir la alimentación con una fuente  convencional  regulada basada  en el clásico transformador con el puente de diodos , gran condensador  y el circuito   de regulación.

placa.PNG

 

El amplificador de audio

Un amplificador 2.1 que podemos comprar ya montada   se  basa  en usar dos  CI:

  •  Un TPA3116D2 en modo maestro 400 kHz, BTL, ganancia si 20 dB, límite de potencia no implementado.
  • Un TPA3116D2 en Esclavo, ganancia del modo PBTL de 20 dB. Las entradas están conectadas para entradas diferenciales.

Es decir usamos dos CI   TPA3116D2 , uno para componer la salida stereo de 50+50W     para dos canales de audio  y un segundo  en configuración mono  para entregar un tope de potencia de 100W

El esquema del montaje como vimos es el siguiente:

esquema.PNG

El  condensador de filtro principal es 4700 uf 35 v, pero para la amplificación de potencia al usar un chip de limitación, este amplificador puede aceptar sólo desde 12v hasta 24 v DC de alimentación y así  el condensador  trabajará en buenas condiciones por lo que no conviene sobrepasar precisamente los 24V DC.

Alimentación del circuito

En cuanto los requisitos de suministro de energía para el TPA3116D2, consisten en un suministro de mayor voltaje para alimentar la salida  etapa del amplificador de altavoz por los que hay arios reguladores están incluidos en el TPA3116D2 para generar voltajes necesarios para el circuito interno de la ruta de audio. La fuente de alta tensión, entre 4.5 V y 26 V, suministra la circuitería analógica (AVCC) y la potencia etapa (PVCC). El suministro de AVCC alimenta LDO interno, incluido GVDD. Precisamente esta salida LDO está conectada a pines externos para fines de filtrado, pero no deben conectarse a circuitos externos. (la salida de GVDD LDO  ha sido dimensionado para proporcionar la corriente necesaria para las funciones internas pero no para la carga externa)

Dada las características  de estos CI  ,por tanto podemos alimentarlos  con batería 12 o 24V   o bien una fuente conmutada de 12-24V de al menos 15 Amp ( con un consumo  máximo típico 7.5 Amp).

A la hora de hacer las  conexiones, solo necesitamos conectar la alimentación externa de 19V  de 6Amp    mayor o igual que 120W,   bien por el jack de 5.5mm -2.1(2.5) con masa al negativo), o bien a la ficha de conexiones que hay justo al lado del conector de alimentación (mucho cuidado con equivocarse  de polaridad).

Una buena solución es optar por una fuente reciclada de alimentación de algun  ordenador portatil de 120W recomendando que al menos sea de 20VDC.

 

EL montaje

La conexiones del circuito no pueden ser mas simples  ya que la placa en si mismo ya integra los controles individuales de los tres amplificadores  de forma individualizada .Los conectores de los altavoces simplemente los conectaremos a las salidas en  la regleta marcada como BASS, OUTL  y OUTR  .

salidas.png

Aunque pueda parecer poco relevante , también aquí se debe respetar escrupulosamente la polaridad de las conexiones a los altavoces pues si uno se equivoca   los altavoces funcionaran en contra-fase  reduciéndose así la potencia de salida total.

IMG_20180829_192255[1]

Para evitar que se toquen las conexiones de los altavoces lo mejor es colocar jack aéreos pues si conectaremos jacks metálicos estos conectarían la masa al chasis, cosa que debemos evitar pues las salidas de los altavoces como vemos en el esquema son independientes y no comparten la masa  así que recomiendo conectar los jacks aéreos , en este caso del tipo RCA  que  pillamos por atrás con los embellecedores de plastico.

Personalmente recomiendo estañar los cables de audio hacia las placa  incluso aunque lo vayamos  a fijar a las tres regletas de salida de los altavoces.

Respecto a los tres potenciómetros :

  1. El de la izquierda es el control de volumen estéreo (sólo para el ajuste de los canales izquierdo y derecho)
  2. El central es el control de volumen del Subwoofer
  3. El control de volumen derecho es global (para 3 canales de ajuste)

entradas

Una solución sencilla es fijar la placa a una tabla de madera  de aproximadamente las dimensiones de la placa del amplificador y pegar esta a la caja de aluminio

IMG_20180829_192255[1]

Respecto la entrada de audio es estereo bien por un jack de 3 1/2″ stereo  o bien con un conector   macho  que hay junto al propio jack.

 

IMG_20180829_192245[1]

Respecto a los tres sendos taladros  para los tres potenciómetros   , normalmente deberían caber en el orificio donde se insertaba el  CD o  DVD ,  por lo que queda es ajustar  los botones de plástico ( entran a presión pero si no se  aprietan simplemente deberemos abrir un poco el eje con un destornillador plano )      y los tornillos  que fijan la placa a la base de madera

 

Finalmente sólo  nos queda la alimentacion donde unicamente habra que conectar la fuente de ordenador  portatil  (de20V DC) al jack de alimentacion

power.png

Como se pude ver, usamos una fuente de 20V de un viejo portatil HP  que conectaremos al jack izquierdo de la pcb  por medio de un nuevo jack.

Por ultimo conectaremos el lado de ca al cableado original del lector de DVD. !y ya esta  todo  , lo cual por cierto podemos complementar con reproductores de mp3, vu-meter digital , etc  aliemntando esta parte con la fuente original del lector de DVD.

IMG_20180829_192305[1]

Finalmente cerraremos la caja , conectaremos el jack de audio de  3 1/2″ a  una salida de audio y  podemos empezar a hacer  las pruebas .

El sonido le sorpendera  si piensa en las reducidas dimensiones de la placa asi como del minimo coste de este

IMG_20180829_192454[1]

Actualización de un viejo radiocasete

El corazón del sistema es un teléfono inteligente con pantalla táctil equipado con software dedicado y memoria para el almacenamiento de música. El teléfono está montado de manera permanente dentro del compartimiento de la cassette mecanizado mecánicamente (se eliminan algunos de los mecanismos de la plataforma). El teléfono también se modifica eléctricamente y se conecta a los circuitos de la plataforma para imitar el comportamiento estándar de la plataforma, p. medidores de nivel de trabajo, algunas regulaciones, nivel de salida ajustable y así sucesivamente. Todas las funciones se manejan tocando la pantalla del teléfono.


Esta claramente   de moda la reutilización  de electrónica antigua a nuevos tiempos acoplando   uno de los elementos mas versátiles que existen como son los smartphones

En este caso se trata de  conversión de  viejas pletinas analógica   donde se instala un smartphone que también puede ser reciclado o desuso   en el hueco originalmente destinado a la cinta de casete.

Para  dar mas  realismo ,mientras el reproductor está en funcionamiento sobre la pantalla del smartphone se muestra la imagen animada de una cinta de casete en movimiento sobre la que ademas podemos interactuar.

En realidad puede parecer ingenioso la conversión ,  pero el proceso  no es demasiado complejo sobre todo si  no se tiene nostalgia de mantener la parte mecánica del casete pues esta no sera útil  , pero  haciendo por tanto el proceso irreversible

 

 

Cada pletina actualizada con este sistema  está llena de posibilidades:

  •  Reproductor de MP3 y FLAC con simulación de casete animado
  •  Radio Internet
  • Reproductor  de Spotify, Tidal, Deezer, Pandora etc.
  •  Radio FM
  •  Carga y administración de música inalámbrica
  •  Control táctil
  •  Almacenamiento interno para archivos de música

 

En realidad como se comentaba ,los pasos para la conversión no son demasiado complejos:

Paso 1 :Elección de la pletina

El primer paso es encontrar una pletina grabadora que sea adecuada para la modificación y luego imaginar y planificar con precisión el efecto final.

Debido a la construcción sólida y duradera y la simplicidad, las pletinas  mecánicas vintage  con amplificador HIFI  incorporado son una de las  opciones preferidos   pues le daremos una segunda oportunidad  al menos a  la parte de BF y de paso recordaremos tiempos pasados.

Algunas grabadoras no son adecuadas para el procesamiento debido a su diseño mecánico y eléctrico. Las viejas y simples cubiertas vintage con teclas mecánicas son una opción favorita para la conversión .La cubierta destinada a la conversión debe ser eléctricamente funcional. Los circuitos de audio, las entradas / salidas, los medidores de nivel, las regulaciones, los interruptores, etc. deberían funcionar correctamente.

El motor, las correas y los engranajes no son importantes, pueden estar rotos o dañados.

 

Obviamente para poder partir de algo sobre lo que montar el smartphone al menos la parte de BF ( es decir la etapa de audio ) debería funcionar para poder continuar la conversión , aunque si esta parte  no funciona también podemos optar por reemplazar la vieja etapa de audio por un amplificador clase D ya montado, pues no ocupan nada de espacio y son realmente económicos .

 

 

Paso 2 Software

El corazón del sistema es un teléfono inteligente con pantalla táctil con software dedicado.

El teléfono debe estar equipado con suficiente memoria incorporada   a ser posible con una tarjeta de memoria adicional para almacenar música.

Es ademas necesario  un cargador adecuado  y  cables de audio de jack de 2 1/2″ stereo a dos conectores macho RCA

En cuanto al software  el abanico es inmenso,como pueden ser Casse-o-player, Cassete Tapes, Easy Music Player, etc

Uno de los mas realistas es Delitape   una app nº 1 para iPhone ahora disponible también para Android. Esta app  rememora el sentimiento de los viejos tiempos y convierte cualquier smartphone moderno en un walkman clásico

 

cintas

Esta app vintage de musica le devuelve a los viejos tiempos. Deslízese por las cintas más elegantes, hechas con pasión por los detalles. Durante la reproducción de los temas, la app simula la forma en que se reproducían las cintas de antes.

Esta app ademas tiene  Soporte de radio de Internet con más de 1000 de las mejores estaciones de radio del mundo web!

Otro app necesaria es Airdroid   pues esta app permite acceder y manejar su teléfono o tableta Android desde Windows, Mac o la web, sin cables, y de forma gratuita.

Cada platina sin cinta ofrece muchas posibilidades: reproductor MP3 / FLAC con animación de cassette, radio por Internet y radio FM (algunos modelos). Si lo desea, puede instalar cualquier aplicación de Android, por ejemplo, su servicio favorito de transmisión de música: Tidal, Spotify, Dezeer, Pandora … o lo que sea que necesite.

 

Paso 3 Montaje

Es hora de ensamblar y combinar componentes, incluidos trabajos mecánicos de precisión .

Lo más difícil es poner el teléfono inteligente en el compartimiento del casete  sin romper nada lo cual necesitara grandes dosis de paciencia  e ingenio

Durante el procesamiento, muchas partes mecánicas se eliminan para siempre, por lo que ya no podrá usar las casetes siendo la conversión irreversible.

Respecto a la electrónica , debemos conectar con cable estero apantallado  desde un jack macho stereo de 2 1/2″ hacia la entrada de auxiliar de la pletina ( bien con conectores RCA o bien soldando a la placa de BF).

Obviamente tampoco debemos olvidarnos de alimentar  al smartphone por lo  que situaremos el cargador en el interior de la pletina tomando  la alimentación de ca directamente desde esta (por ejemplo a la salida de interruptor mecánico de power que este tipo de equipos llevan)

La batería se cargara automáticamente cuando se encienda la plataforma. Si no usa la plataforma durante un período prolongado, recuerde apagar el teléfono para evitar descargar la batería por completo. En caso de que la batería esté descargada, simplemente encienda la plataforma y espere un momento hasta que el teléfono muestre signos de vida. Luego encienda el teléfono nuevamente.

Para  operar el teléfono dentro de la plataforma se hará al igual que un teléfono estándar, con una excepción, ya que el teléfono está integrado en la plataforma y el conmutador de encendido / apagado es de difícil acceso, por lo que  lo  “correcto” seria  conectarlo  eléctrica mente a una de las teclas de la plataforma y así funcionaria de la misma manera que el original.

El resultado como se podía  esperar  es bastante impresionante  dependiendo mucho de como seamos capaces de disimular el smartphone dentro de la pletina :

 

Finalmente, el dispositivo se ve y actúa como una platina de cinta real, que incluye una fascinante animación de casete, medidores de nivel de trabajo, señal de salida ajustable, etc. Hermosa pieza de artesanía hecha a mano. Además, cada TapeLess Deck MP3 es un dispositivo único y artesanal, el único en el mundo.

 

Paso 4: Subir y administrar música…

Para preparar  el smartphone , conecte  el  WiFi del smartphone e inicie sesión en su red doméstica. Recuerde que sin cubierta y ordenador  deben trabajar en la misma red.
 
Haga clic en el icono de AirDroid y espere pacientemente a la siguiente pantalla. En el primer uso toma algún tiempo…
Encuentre y haga clic en el icono azul de la AirDroid Web. A veces puede ser cubierto por los anuncios, así que mire con atención…
Espere al respuesta del servidor y escriba dado la dirección exactamente para el navegador de su ordenador.
Vaya a su ordenador  e introduzca  la url citada en un navegador .Ahora verá una página web generada por AirDroid. Contiene algunas informaciones útiles acerca de los teléfonos sin cubierta, como memoria disponible o estado de la batería y mucho mas
 
Haga clic en el icono de archivos y localize la carpeta MUSIC en la tarjeta SD o tarjeta SD externa (dependiendo de la configuración del teléfono). Es el momento para cargar música del ordenador a la memoria del smartphone:Abra la carpeta con la música en su ordenador  seleccione los archivos y sólo tiene que arrastrar a la! Ventana _MUSIC. Espere a que la transferencia hasta el final.

 

 

 

Por cierto esta idea se puede extender no solo a una pletina hifi, también  radiocasete , equipos compactos , etc ¿tiene alguno  de estas viejas leyendas en el trastero  y no sabe que hacer con estas pues con un viejo smartphone le puede dar otra nueva vida?

 

 

Fuente  http://www.mp3tapelessdeck.pl/

Transcripcion de ficheros de audio

comsCore vaticina que en 2020 la mitad de las búsquedas en Internet se harán con la voz, algo para lo que contaremos con la ayuda de asistentes personales como Siri, Sherpa, Google Now, Amazon Echo o Cortana.
Asimsmo bastará con dar una orden con la voz para obtener al instante lo que queremos, sin tener que escribir esa petición. Ahora bien, de momento estos asistentes pueden quedarse cortos si necesitamos dictarles textos asi que veamos dos buenas herramientas que podemos integrar en nuestras apps o simplemente usarlas desde sus paginas de demostracion


Puede parecer algo anacrónico, pero  lo cierto es que probablemente el teclado y ratón tal como los conocemos  hoy en día tenga  sus días contados   gracias al espectacular avance  sufrido estos años   en apartado de  reconocimiento de voz   usando redes neuronales  claramente  propiciado  por en las ingentes subida de  capacidades de computo gracias al  Cloud  Commputing  ,el Big Data y el aprendizaje automático

Veamos algunas soluciones de reconocimiento de voz  liderado por grandes proveedores como pueden ser Google o IBM

speech-api-lead

Google Cloud Speech

En efecto desde Google proponen la API Speech de Google Cloud , la cual  permite que los desarrolladores conviertan audio en texto aplicando potentes modelos de redes neuronales en una API fácil de usar. La API Speech reconoce más de 80 idiomas y sus variantes para gestionar una clientela internacional. Asimismo, se puede filtrar el contenido inapropiado en los resultados de texto.

La API Speech de Cloud se tarifica por intervalos de 15 segundos de audio procesados después de los 60 primeros minutos, que son gratuitos.

USO MENSUAL PRECIO POR CADA 15 SEGUNDOS*
Hasta 60 minutos Gratuito
61 – 1.000.000 de minutos* 0,006 $

*Este precio es válido para aplicaciones de sistemas personales (por ejemplo, teléfonos, tablets, portátiles y ordenadores).  El uso mensual está limitado a un millón de minutos.

Se puede transcribir el texto que los usuarios dictan al micrófono de una aplicación, habilitar el control por voz o transcribir archivos de audio, entre muchas otras funciones.

La API Speech puede transmitir resultados de texto conforme vaya reconociendo el audio, de forma que el texto reconocido aparece inmediatamente mientras la persona habla  asi que consigue resultados de texto en tiempo real

De igual modo, la API puede reconocer el texto a partir del audio almacenado en un archivo pero solo si se tiene cuenta en Google Cloud.

Como   “truco” casero para  probar   la funcionalidad del API se  puede inyectar  el audio  ya grabado desde un dispositivo externo  por  medio de un cable de audio que lo  introduciría en el pc  seleccionando como dispositivo grabador la entrada de audio :debería funcionar exactamente igual que si hablamos por un micrófono

En el caso de que este validado contra Google  y  tenga cuenta en Google Cloud este paso se puede obviar porque se pueden subir directamente los ficheros que deseamos transcribir mediante la opción File Upload  teniendo en cuenta la limitación de 60 minutos en caso de no querer pasar por caja

Si quiere probar esta funcionalidad esta es la url : https://cloud.google.com/speech-to-text/

 

Como no podía ser de otra manera, también  es posible reconocer el audio subido en la solicitud e integrarlo en su almacenamiento de audio de Google Cloud Storage. 

Gracias a  la tecnología del aprendizaje automático ,se aplican los algoritmos más avanzados de redes neuronales del aprendizaje profundo al audio de sus ficheros  para conseguir un reconocimiento de voz de máxima precisión. Mencionar que como todos los  sistemas de aprendizaje con redes neuronales la precisión de la API Speech mejora con el tiempo, conforme perfeccionan la tecnología interna de reconocimiento de voz que usa los productos de Google.

No se necesitan pues  sistemas avanzados de procesamiento de señales ni reducción de ruido antes de enviar el audio a la API Speech. El servicio es capaz de procesar audio ruidoso procedente de diversos entornos de forma satisfactoria.

El reconocimiento de voz se puede adaptar al contexto suministrando un conjunto independiente de palabras clave con cada llamada a la API, lo que resulta especialmente útil para las situaciones de control de dispositivos y aplicaciones.

La API Speech es compatible con cualquier dispositivo que pueda enviar solicitudes REST o gRPC, incluidos teléfonos, ordenadores, tablets y dispositivos con Internet de las Cosas (por ejemplo, coches, televisores o altavoces).

CARACTERÍSTICAS DE LA API SPEECH

Conversión de voz en texto gracias al aprendizaje automático

El reconocimiento automático de voz (ASR) basado en redes neuronales de aprendizaje profundo dota a las   aplicaciones , la funcionalidad  de búsqueda por voz o transcripción de voz.Reconoce más de 80 idiomas y variantes, con un amplio vocabulario proporcionando resultados de reconocimiento mientras los usuarios siguen hablando.
Es posible personalizar el reconocimiento de voz según un contexto específico suministrando un conjunto de palabras y frases que tienen muchas probabilidades de aparecer. Esto resulta especialmente útil para añadir palabras y nombres personalizados al vocabulario, así como en situaciones de control por voz.
El sonido puede proceder del micrófono de una aplicación o de un archivo de audio grabado previamente. Se admiten diversas codificaciones de audio, como FLAC, AMR, PCMU y Linear-16.
Es capaz de procesar audio de diversos entornos ruidosos sin necesidad de reducción de ruido adicional así que puede filtrar contenido inapropiado en los resultados de texto para algunos idiomas.
El  API como vemos esta integrada:los archivos de audio se pueden subir en la solicitud o integrar en Google Cloud Storage.

Transcripción de archivos de audio cortos

Es muy sencillo transcribir un archivo de audio corto a texto utilizando el reconocimiento de voz sincrónico.

El reconocimiento de voz síncrona devuelve el texto reconocido para audio corto (menos de ~ 1 minuto) en la respuesta tan pronto como se procese(para procesar una solicitud de reconocimiento de voz para audio largo, use el Reconocimiento de voz asincrónico ).

El contenido de audio se puede enviar directamente a Cloud Speech-to-Text, o puede procesar contenido de audio que ya reside en Google Cloud Storage.

Speech-to-Text v1 se lanzó oficialmente y, en general, está disponible desde el extremo https://speech.googleapis.com/v1/speech . Las bibliotecas de cliente se lanzan como alfa y es probable que se modifiquen de formas incompatibles hacia atrás. Las bibliotecas del cliente actualmente no se recomiendan para uso de producción.

Estas muestras requieren que haya configurado gcloud y haya creado y activado una cuenta de servicio.

Realización de reconocimiento de voz síncrono en un archivo local

Aquí hay un ejemplo de cómo realizar el reconocimiento de voz sincrónico en un archivo de audio local mediantes comados de GCLOUD

Consulte el comando de recognize para obtener detalles completos.Para realizar el reconocimiento de voz en un archivo local, use la herramienta de línea de comandos de gcloud , pasando la ruta de archivo local del archivo para realizar el reconocimiento de voz.

 gcloud ml speech reconoce CAMINO-AL-LOCAL-FILE --language-code = 'en-US'

Si la solicitud es exitosa, el servidor devuelve una respuesta en formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Realización de reconocimiento de voz síncrono en un archivo remoto

Para su comodidad, la API de voz a texto puede realizar el reconocimiento de voz sincrónico directamente en un archivo de audio ubicado en Google Cloud Storage, sin la necesidad de enviar el contenido del archivo de audio en el cuerpo de su solicitud.

Aquí hay un ejemplo de cómo realizar el reconocimiento de voz sincrónico en un archivo ubicado en Cloud Storage  usando comandos  GCLOUD

Consulte el comando de recognize para obtener detalles completos.Para realizar el reconocimiento de voz en un archivo local, use la herramienta de línea de comandos de gcloud , pasando la ruta de archivo local del archivo para realizar el reconocimiento de voz.

 gcloud ml speech reconoce 'gs: //cloud-samples-tests/speech/brooklyn.flac' \
 --language-code = 'en-US'

Si la solicitud es exitosa, el servidor devuelve una respuesta en formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Mas  informacion en https://cloud.google.com/speech-to-text/docs/sync-recognize?hl=es#speech-sync-recognize-gcloud

IBM

También esta disponible para testeo  Watson de IBM, que permite  dictado a texto

El servicio IBM Watson Speech to Text utiliza capacidades de reconocimiento de voz para convertir el árabe, el inglés, el español, el francés, el portugués de Brasil, el japonés y el mandarín en texto.Este sistema por el momento se usa o para fines de demostración y no está destinado a procesar datos personales ,así  que no se deben ingresar datos personales en este sistema, ya que puede no tener los controles necesarios para cumplir con los requisitos del Reglamento general de protección de datos (UE) 2016/679.

Lo mas destacable DE Watson es asimismo la capacidad de transcribir audio done se puede usa su micrófono para grabar audio o cargar audio pregrabado (.mp3, .mpeg, .wav, .flac o .opus solamente).

Incluso puede reproduzca uno de los archivos de audio de muestra para probar el servicio , ahora eso si los archivos de audio de muestra de banda ancha son en inglés de EE. UU y están cubiertos por la licencia de Creative Commons.

El resultado devuelto incluye el texto reconocido, las alternativas de palabras y las palabras clave moteadas. Algunos modelos pueden detectar múltiples altavoces; esto puede ralentizar el rendimiento.

A continuación esta es la url para probar el servicio en modo  demo: https://speech-to-text-demo.ng.bluemix.net/

 

En teoría los primeros 1000 minutos al mes son gratis en el servicio estándar,   así que el limite es muy superior de uso gratuito al de Google .

¿Le parece mejor opción la de IBM  que la de Google?¿Conoce algún otro servicio gratuito que podamos usar desde nuestras apps? Sin duda  la carrera por copar este mercado no acaba mas que empezar