Banco de dados básico | Especificações | Typosquatting Data Feed | WhoisXML API

Basic database

Amostra

Disponibilidade de dados

Tipo de assinatura Descrição
Atualizações diárias Estão disponíveis até as 18h00 UTC na maioria dos dias. Em alguns dias, como a geração de dados de entrada provenientes de outros feeds diários pode levar mais tempo, os dados são gerados 8 horas depois.
Atualizações semanais As semanas começam no domingo. Os arquivos de dados da última semana ficam disponíveis na segunda-feira, às 20h UTC, todas as semanas.
Atualizações mensais Os arquivos de dados do último mês estão disponíveis no segundo dia do mês, às 20h UTC.

Convenção de nomenclatura

Tipo de assinatura Descrição
Atualizações diárias typosquatting.YYYY-MM-DD.daily.full.basic.csv
Atualizações semanais typosquatting.YYYY-MM-DD.weekly.full.basic.csv onde a data corresponde a um domingo, que é o último dia cujos dados estão incluídos no arquivo. Assim, considera-se que uma semana começa na segunda-feira anterior, termina no domingo no nome do arquivo e o arquivo é publicado na segunda-feira seguinte após a data no nome do arquivo.
Atualizações mensais typosquatting.YYYY-MM-DD.monthly.full.basic.csv onde a data corresponde ao primeiro dia do mês seguinte, por exemplo, os dados de julho de 2020 estão no arquivo typosquatting.2020-08-01.monthly.full.basic.csv.


Observe que os dados semanais e mensais são derivados da concatenação dos respectivos dados diários e da adição do primeiro campo, a data.

Estrutura CSV

Os arquivos de dados básicos são arquivos de valores separados por vírgulas, sem delimitadores de texto. Os arquivos usam terminadores de linha no estilo DOS/Windows (CR+LF). A primeira linha é uma linha de cabeçalho com os nomes dos campos. Cada linha tem quatro ou cinco campos dependendo do tipo de assinatura:

Campo Descrição
data O dia em que o grupo foi detectado (somente em arquivos semanais e mensais).
group_number Número ordinal do grupo em um determinado dia (no caso de assinatura diária, dentro do arquivo).
group_member_number Número ordinal do domínio dentro do grupo.
total_no_of_grp_members Número de membros do grupo dentro do grupo.
domain Nome de domínio
domain_utf Nome de domínio transcrito para Unicode; somente para domínios com caracteres nacionais (não ingleses).


Por exemplo, dois grupos adjacentes, nº 1058 e 1059, com 3 e 5 membros, respectivamente, aparecem no arquivo como:

...
1058,1,3,slut.bar,
1058,2,3,slut.events,
1058,3,3,slut.red,
1059,1,5,worldthinkcreativity.online,
1059,2,5,worldthinkcreativity.org,
1059,3,5,worldthinkcreativity.com,
1059,4,5,worldthinkcreativity.info,
1059,5,5,xn--wrkdthinkcreativity-g5c.net,wırkdthinkcreativity.net
...

O último domínio da lista tem um caractere não inglês ("i" sem ponto) como segunda letra, conforme visto no campo último campo não vazio. Em um arquivo semanal ou mensal, as linhas de um grupo terão a seguinte aparência

...
2020-08-17,3,1,9,app1e1d05.com,
2020-08-17,3,2,9,app1e1d09.com,
2020-08-17,3,3,9,app1e1d03.com,
2020-08-17,3,4,9,app1e1d04.com,
2020-08-17,3,5,9,app1e1d02.com,
2020-08-17,3,6,9,app1e1d01.com,
2020-08-17,3,7,9,app1e1d07.com,
2020-08-17,3,8,9,app1e1d08.com,
2020-08-17,3,9,9,app1e1d06.com,
...

Observe que são a data e o número ordinal do grupo (os dois primeiros campos) que identificam o grupo de forma exclusiva nesses arquivos.