1º) Converter o arquivo PDF para doc.
2º) Selecionar todo o texto, copiá-lo e colá-lo como texto não-formatado.
3º) Faça uma limpeza no texto, eliminando páginas irrelevantes como capa e sumário.
4º) Usar a função substituir (Ctrl + l) do Word para localizar todos os caracteres espaço " " e substituí-los por um parágrafo (^p).
5º) Selecione todo o texto e cole em um arquivo do Excel. Este arquivo ficará com uma coluna apenas preenchida.
6º) Ordene esta coluna por ordem alfabetica através da função "Classificar e Filtrar" do Excel.
7º) Se desejar, faça mais uma limpeza nesta coluna. O resultado até aqui é uma coluna ordenada com todas as palavras do texto.
8º) Na coluna ao lado, faça a seguinte fórmula para eliminar as palavras repetidas =SE(A2=A1;;A2). Se a coluna com todas as palavras do texto é a coluna A e as células com estas palavras são da A1 até a A500, por exemplo, esta fórmula deve ser feita na coluna B da célula B2 até B500. Lembre-se de copiar a célula A1 para a B1.
9º) Copie toda esta coluna B, e em outra coluna cole apenas os valores desta coluna (ATENÇÃO: Não cole as fórmulas!). Use a função do próprio excel "colar valores" para isto.
10º) Ordene esta terceira coluna.
11º) Excluir todas as células desta coluna que tenham o valor 0, ou seja, todas as células que seriam de valores repetidos. Ao final deste processo temos todas as palavras do texto, ordenadas e não-repetidas.
12º) Salve SOMENTE ESTA COLUNA em um novo arquivo formato TXT (Texto-MSDOS no "Salvar Como do Excel 2007).
13º) Abra o 1º arquivo doc (aquele que foi convertido do PDF) e insiram uma quebra de páginas no final do arquivo, para adicionar o índice remissivo.
14º) Na aba "Referências". do Word, vá na opção "Inserir Índice".
15º) Clique na opção "AutoMarcação...".
16º) Selecione o arquivo TXT do passo 12. O Word marcará todas as palavras do arquivo txt no arquivo doc.
17º) Na aba "Início", desmarque a opção "Mostrar marcas de parágrafo" ou (Ctrl + *).
18º) Vá novamente na aba "Referências". do Word, opção "Inserir Índice".
19º) Na aba "Índice Remissivo" escolha as opções desejadas como número de colunas, por exemplo.
20º) Clique em OK. Pronto! Agora você tem um índice remissivo com todas as palavras do texto.
Queria no máximo 3 passos.
ResponderExcluir