¿Hay alguna manera de descargar las transcripciones de YouTube generadas automáticamente sin descargar el video?
Me gustaría consultar las charlas de TED, pero tengo un ancho de banda limitado y me gustaría exportar las transcripciones automáticas (posiblemente también conocidas como subtítulos o subtítulos).
Respuestas:
Use la función "Inspector de red" del depurador de scripts de su navegador y encuentre la segunda solicitud para la página de texto cronometrado después de habilitar los subtítulos transcritos, luego copie toda esa solicitud en la barra de direcciones para descargarlos en formato xml nativo de YouTube.
Para obtener la versión SRT, ejecute este código en la consola del depurador para la página de ese xml:
También aquí está la versión bookmarklet del script:
fuente
Hay un par de formas de extraer subtítulos de un video de YouTube :
Al especificar el idioma y VideoId en esta URL genérica,
http://www.youtube.com/api/timedtext?lang={LANG}&v={VIDEOID}
puede obtener un.xml
archivo que contiene los subtítulos en el idioma deseado para un video elegido.Para deshacerse de las etiquetas dentro de ese archivo y simplemente tener la transcripción de texto plano , esto es lo que debe hacer:
Alternativamente, hay una herramienta de código abierto llamada Google2SRT que descarga todos los suscriptores disponibles de un video de YouTube con un solo clic y los convierte en
.srt
formato para que pueda usarse en reproductores multimedia como VLC Media Player.Actualización: Ted.com ahora proporciona transcripciones de las conversaciones en su sitio.
fuente
http://video.google.com/timedtext?lang=english&v=b11AXknrsEI
pero no funciona. Además, ir a herramientas de desarrollador no ayuda. Hay toneladas de recursos allí y ninguno de ellos dice texto cronometrado.english
aen
yeng
pero hace lo mismo.Creo que este script de usuario debería funcionar para usted:
http://userscripts.org/scripts/show/50003/
fuente
Google2SRT 0.6 admite ASR de YouTube: http://sourceforge.net/projects/google2srt/
fuente
Si es su propio video, puede descargar los subtítulos desde el administrador de videos. Ir:
Administrador de video >> Editar (en el video que desea) >> Subtítulos >> (Haga clic en la pista que desea descargar) >> Acciones (cuadro desplegable)
Al momento de escribir, hay tres tipos de archivos disponibles:
Estos tienen diferentes usos en diferentes aplicaciones, pero son muy similares. SRT es probablemente el más común.
De lo contrario, si no es su video, el mejor método (único método) es obtener el archivo xml de las herramientas del desarrollador.
Usando Google Chrome en este ejemplo, navegue hasta el video y luego siga estos pasos:
timedtext?
más un montón de variables. El segundo suele ser el que desea. Comienza así:<transcript> <text start="4.14" dur="3.049">my name is doctor john rush</text> <text start="7.189" dur="3.731">I'm the CEO and president</text>
Este archivo xml es útil si desea utilizar la transcripción en una página web. Aparte de eso, no creo que pueda usarlo de la misma manera que usaría un archivo SRT. Si eres bueno programando, puedes escribir fácilmente un programa que lo convertirá a SRT. Escribí mi propio programa C # que extrae los datos para un propósito diferente y me llevó menos de dos horas.
fuente