Si un archivo de video dice que tiene 30 fps y 10 segundos, ¿puede extraer exactamente 300 imágenes?
¿Cada tipo de archivo de video consiste en una colección de imágenes?
Eso será cierto solo si tienes un video sin comprimir.
Los videos normalmente usan compresión, por lo que actualizan la parte de la pantalla que cambió, y no toda la pantalla, cada vez (esto depende del códec y el tipo de compresión).
Puedes ver más sobre esto aquí: https://en.wikipedia.org/wiki/Video_coding_format