Banco de dados da comunidade | Especificações | Typosquatting Data Feed | WhoisXML API

Community database

O Typosquatting Community Feed contém arquivos de teste diários limitados que são versões filtradas dos arquivos completos que incluem um subconjunto de grupos e, para arquivos enriquecidos, é um subconjunto de colunas.

Saiba mais sobre como fazer o download desse banco de dados localmente ou no Snowflake aqui.

Amostras

Disponibilidade de dados

Tipo de assinatura Descrição
Atualizações diárias Estão disponíveis até as 18h00 UTC na maioria dos dias. Em alguns dias, como a geração de dados de entrada provenientes de outros feeds diários pode levar mais tempo, os dados são gerados 8 horas depois.

Convenção de nomenclatura

Tipo de assinatura Descrição
Atualizações diárias typosquatting.YYYY-MM-DD.daily.trial.[basic|enriched].csv

Estrutura CSV

Os arquivos de dados são arquivos de valores separados por vírgulas, sem delimitadores de texto. Os arquivos usam terminadores de linha estilo DOS/Windows (CR+LF). A primeira linha é uma linha de cabeçalho com os nomes dos campos.

Arquivos de teste básicos

Campo Descrição
group_number Número ordinal do grupo em um determinado dia (no caso de assinatura diária, dentro do arquivo).
group_member_number Número ordinal do domínio dentro do grupo.
total_no_of_grp_members Número de membros do grupo dentro do grupo.
domain Nome de domínio
domain_utf Nome de domínio transcrito para Unicode; somente para domínios com caracteres nacionais (não ingleses).

Arquivos de teste enriquecidos (Enriched)

Campo Descrição
group_number Número ordinal do grupo em um determinado dia (no caso de assinatura diária, dentro do arquivo).
group_member_number Número ordinal do domínio dentro do grupo.
total_no_of_grp_members Número de membros do grupo dentro do grupo.
domain Nome de domínio
domain_utf Nome de domínio transcrito para Unicode; somente para domínios com caracteres nacionais (não ingleses).
registrant_country Do registro WHOIS.
registrarName Do registro WHOIS.
status Do registro WHOIS; códigos de status EPP do domínio.
standardRegCreatedDate Data e hora do registro no formato padrão (consulte o comentário em "createdDate").
standardRegExpiresDate Data de expiração em formato padrão.
IPs Uma lista, separada por espaços, de endereços IPv4 atribuídos ao domínio de acordo com uma pesquisa de DNS no dia ou no dia seguinte à data do arquivo.


Os grupos citados acima são selecionados usando "buzzwords" e incluem o primeiro grupo, que tem a palavra-chave como substring em pelo menos um domínio e não foi incluído junto com uma palavra-chave anterior, se existir. As buzzwords normalmente são nomes de marcas e palavras populares em typosquatting como, por exemplo, settlement, bank ou suporte.

Download via Snowflake

Os usuários do Snowflake podem fazer o download do feed aqui.