Triagem de corpus
Identifique quais URLs estão mais próximas de um conceito analítico e quais podem compor uma amostra qualitativa mais promissora para leitura aprofundada.
Ferramenta metodológica para comunicação e informação
Transforme sites, editorias ou listas de URLs em evidências estatísticas para análise de corpus.
Uma análise vetorial orientada à pesquisa científica: você descreve o projeto, informa um sitemap ou cola uma lista de URLs, define o conceito analítico central e recebe mapas, métricas e planilhas CSV para apoiar triagem, amostragem, análise longitudinal, comparação temática e exploração de clusters.
Não é uma ferramenta de interpretação automática final. É uma camada computacional de apoio metodológico: o sistema organiza, mede e visualiza proximidades semânticas para que o pesquisador conduza a interpretação teórica e qualitativa.
O conteúdo das URLs é extraído, convertido em embeddings e comparado ao conceito informado para gerar scores, zonas, clusters e arquivos de apoio.
| URL | Score | Zona |
|---|---|---|
| /editoria/saude | 0.812 | Core |
| /noticia/politica | 0.786 | Focus |
| /arquivo/opiniao | 0.742 | Peripheral |
A entrega pode incluir score por URL, subpath/editoria, clusters, estatísticas descritivas e arquivos compatíveis com planilhas e softwares de análise.
Uso metodológico
O mapa semântico funciona como um instrumento de exploração, triagem e organização de corpus. Ele pode apoiar pesquisas em jornalismo, comunicação, ciência da informação, desinformação, estudos de plataforma, análise de cobertura e investigações sobre regimes de visibilidade.
Identifique quais URLs estão mais próximas de um conceito analítico e quais podem compor uma amostra qualitativa mais promissora para leitura aprofundada.
Observe se um site ou conjunto de URLs se concentra em torno de um conceito, se há dispersão semântica ou se existem subgrupos temáticos relevantes.
Agrupe textos semanticamente semelhantes para investigar padrões editoriais, linhas discursivas, editorias, recortes temáticos e possíveis categorias emergentes.
Use scores, distância semântica e clusters para justificar escolhas de amostra com mais transparência do que uma seleção puramente impressionista.
Quando o corpus contém datas, os dados podem apoiar leituras sobre mudança de foco, deslocamento temático e evolução da cobertura ao longo do tempo.
Compare sites, editorias, seções ou listas de URLs para observar diferenças de proximidade com um conceito, uma categoria analítica ou uma descrição teórica.
Como formular o conceito
A análise vetorial permite usar descrições mais amplas como referência. Isso é útil quando o pesquisador não quer medir apenas a presença de termos, mas a proximidade semântica entre textos e uma formulação conceitual.
Em vez de usar apenas “saúde”, “Google” ou “desinformação”, o pesquisador pode formular descrições mais próximas do objeto teórico, desde que reconheça que o resultado é indiciário e deve ser interpretado metodologicamente.
“Alegações médicas sem fonte científica clara e recomendações de saúde sem evidência clínica.”
“Uso de plataformas digitais como fontes de dados, prova jornalística ou evidência de interesse público.”
“Disputas por autoridade informacional, visibilidade, mediação técnica e legitimidade de fontes.”
“Dependência estrutural de plataformas digitais para circulação, monetização, infraestrutura e distribuição de conteúdo.”
Entregáveis
A entrega é pensada para apoiar pesquisa, não apenas apresentação visual. Além dos mapas, o foco está nos dados exportáveis para documentação, auditoria e análise posterior.
Arquivo com URL, título, subpath, contagem de palavras, score de similaridade, zona semântica e outros campos disponíveis na extração.
Média, mediana, moda arredondada, desvio padrão, mínimo, máximo e distribuição por faixas de proximidade semântica.
Agrupamento por proximidade vetorial para apoiar identificação de temas emergentes, subcorpus e categorias de análise.
Visualizações por percentil, threshold absoluto e clusters, úteis para apresentação metodológica, seminários, relatórios e artigos.
A análise pode partir de um sitemap inteiro, de um sub-sitemap específico ou de uma lista controlada de URLs selecionadas pelo pesquisador.
Os arquivos ajudam a registrar critérios de seleção, distribuição do corpus e justificativas para recorte amostral.
Fluxo de análise
O processo foi desenhado para receber uma descrição metodológica mais longa, tratar o corpus informado e devolver dados que possam ser reutilizados pelo pesquisador.
Informe objetivo, corpus, conceito analítico, hipótese ou recorte que orienta a análise.
Use um sitemap, uma seção do site ou uma lista de URLs selecionadas previamente.
As páginas são extraídas, vetorizadas e comparadas ao conceito ou descrição semântica central.
Os resultados são enviados em mapas e planilhas CSV para apoiar sua análise científica.
Solicitação
Preencha os dados abaixo, descreva o projeto e informe o corpus. Depois do envio, você verá as instruções de Pix para confirmar a análise.
Descreva seu projeto, informe um sitemap ou cole uma lista de URLs. Após a análise, você receberá dados estatísticos e planilhas CSV.
FAQ
Não. Ela oferece uma camada computacional de evidências e organização do corpus. A validação teórica, metodológica e interpretativa continua sendo responsabilidade do pesquisador.
Sim. O conceito pode ser uma frase ou descrição analítica mais ampla. Isso costuma ser melhor do que usar apenas uma palavra isolada, especialmente em objetos complexos.
Sim. O formulário de pesquisa aceita tanto sitemap quanto lista de URLs. Isso permite trabalhar com corpus previamente curado, amostras ou recortes específicos.
A saída pode incluir URL, título, subpath, contagem de palavras, score de similaridade, classificação semântica, clusters e estatísticas descritivas, conforme o corpus e a extração permitirem.
Não. A ferramenta pode apoiar a pré-análise, a exploração do corpus e a seleção amostral, mas não substitui leitura qualitativa, codificação manual, validação intercodificador ou interpretação teórica.
Sim, desde que usado com cautela metodológica. O mapa pode indicar proximidade semântica com descrições de desinformação, mas a confirmação exige leitura, critérios analíticos e validação humana.
Sim. Os mapas podem ser utilizados como visualizações metodológicas, desde que o procedimento seja descrito com transparência e sem tratar o score como classificação definitiva.