Autor Tópico: [Resolvido] Tesseract-ocr converte com caracteres estranhos.  (Lida 1680 vezes)

Offline mauricio_luciano

  • Usuário Ubuntu
  • *
  • Mensagens: 54
    • Ver perfil
[Resolvido] Tesseract-ocr converte com caracteres estranhos.
« Online: 19 de Junho de 2010, 03:30 »
Oi.  :) Eu conheci o Tesseract-ocr quando ainda estava no Karmic e ele funcionava muito bem. Primeiro eu extraia as legendas do dvd em formato de imagem .tif e depois dava o comando...

--> for i in $(ls); do tesseract $i $i -l por; done <--

para converter as imagens em texto, e assim por fim criar o arquivo de legenda. Só que agora no Lucid ele gera uns textos estranhos...

--> http://www.fileupyours.com/files/283001/tess_erro.jpg <--

Alguma ideia ?  :-\
« Última modificação: 19 de Junho de 2010, 15:34 por mauricio_luciano »

Offline mauricio_luciano

  • Usuário Ubuntu
  • *
  • Mensagens: 54
    • Ver perfil
Re: Tesseract-ocr converte com caracteres estranhos.
« Resposta #1 Online: 19 de Junho de 2010, 15:31 »
Consegui!  :D   O problema estava nesse comando --> subtitle2pgm -o pt -c 255,255,0,255 < subs-pt <--

só precisei alterar para --> subtitle2pgm -o pt -c 255,0,255,255 < subs-pt <-- deixando a cor da fonte mais forte.

Obrigado. Abraços.  8)