A) Instalando FITYK
Para a Análise Matemática (agradecimentos a
Marco Aurélio Sichirolli Lavrador, Prof. da USP, Matemático) dos Dados, foi usado o pacote de ajuste de curvas
FITYK.
Embora não estivesse previamente instalado no Mandriva, foi usada a versão 0.8.9, rodando direto a partir do Live CD do Linux Científico Brasileiro (da Universidade de Rio Grande),
Poseidon 3.1.
Desejando instalar a versão nova (0.9.2, de 7/5/2010 ou seus "nightly builds"), procure-a nos repositórios (por exemplo, existe no Portage do Gentoo) ou baixe-a para sua distro, a partir do endereço:
ou usando o código-fonte compilável da própria Home-Page, ou baixado via SVN e instalado com os comandos:
cd /
$ cd /home/Desktop/usuario/pacotes
$ sudo svn co https://fityk.svn.sourceforge.net/svnroot/fityk/trunk fityk
$ cd fityk
$ sudo chmod +x autogen.sh
$ sudo sh autogen.sh
$ make
$ sudo make install
A instalação necessita dos pacotes dependências
xylib e
gnuplot/.
O FITYK é um pacote livre e de código aberto, fácil de usar, para ajuste de retas e curvas Analíticas ou para aplicações científicas.
B) Plotando os dados:
Para avaliação (Figura 1) as velocidades médias de download em função do tempo (para todos os protocolos de download usados, exceto os pouco reprodutíveis como Orbit e GGet) foram tabeladas e depois plotadas no FITYK.
No eixo vertical (y), o tempo, de 0 a 10 minutos e no eixo horizontal (x) as velocidades (em Kb/ps).
Por Análise Matemática, verificou-se que após a estabilização da velocidade (entre 255 e 366 Kb/ps) o tempo de download se torna uma função aproximadamente linear da velocidade, ou tendendo a ser linear fora dos extremos da faixa (como representado na Figura 1, em Branco).
Por outro lado, em velocidades baixas ou não estabilizadas, abaixo de 155 Kb/ps e principalmente entre 230 e 254 Kb/ps, o download é extremamente sensível e intervém um grande número de fatores variáveis inter-relacionados e dificilmente isoláveis (visível na Figura 1, em Vermelho).
Aplicou-se à plotagem, por tentativa e erro, vários tipos de curvas para encontrar o ajuste melhor e verificou-se que a mais próxima, com menores erros, é uma função tipo Lorentziana (na Figura 1, em Amarelo, e abaixo, próximo ao eixo horizontal, em Vermelho), como é comum acontecer com outros fenômenos multivariáveis.
Neste distribuição de
Cauchy-Lorentz ocorre a existência apenas de uma "região de probabilidade, ou de uma densidade de probabilidade", necessariamente sem média e nem desvio padrão definidos, ao contrário das distribuições normais mais comumente encontradas na prática como a Linear e a Gaussiana.
Em distribuições Lorentz, torna-se inútil calcular uma média ou desvio padrão.
Para corrigir a curva, buscar os pontos melhores, reduzindo o número de pontos errôneos e descartando as medidas menos exatas, foi aplicado um método tipo Simplex (Algoritmo
Nelder-Mead.
Métodos
Simplex são recomendados principalmente para processos com grande número de variáveis não controláveis, como é o caso dos downloads.
O Simplex ajustou a curva com diferença entre a curva grosseira média e a ideal de apenas 9,7 X 10 a -5, com uma confiabilidade aceitável para um Simplex, de 86,9 %.
A Figura 2 mostra (em Verde) a curva depois de corrigida pelo Simplex:
c) Análise e discussão:
Estes dados sugerem, como esperado, que o tempo de download é variável e muito instável quando a velocidade não é constante. Quando ela se estabiliza, o tempo de download se torna mais constante tendendo o download a ser mais rápido quanto maior a velocidade.
Vê-se também que os diversos protocolos e métodos de download, seja em Windows como em
Linux, podem ser comparados.
Ainda observando-se os downloads, pode-se ver que os aceleradores de download não são muito eficientes em banda larga, ao menos nas condições dos experimentos.
Por exemplo o clássico wget, gerencia os downloads com velocidade comparável aos aceleradores.
Testes com Internet discada não foram feitos, pois não possuo no computador, no momento, modem para conexão discada.
Os auxiliares (gerenciadores e aceleradores de download), observados do ponto de vista semi-quantitativo, são similares em performance e eficiência, com pequeno favoritismo de Aria2 e Prozilla, ligeiramente mais rápidos.
Os resultados não conclusivos de Orbit e de GGet podem não indicar ineficiência desses aceleradores, mas simplesmente que a Rede poderia não estar estável no momento do download. Contudo, para uma avaliação mais rigorosa, outros testes deverão ser feitos, usando somente esses dois aceleradores, comparando-se com condições não aceleradas.
Cabem aqui observações acerca do Filezilla. Este é um interessante cliente FTP a moda antiga, que loga o usuário como anônimo, usando o endereço de email completo como senha. Clientes como esse eram muito usados nos primórdios da Internet, quando quase todos os downloads eram feitos a partir de servidores FTP.
Outra observação decorrente de meus Experimentos, é que ao menos nos espelhos do Gentoo na UNICAMP, não há grande diferença de velocidade entre entre os servidores FTP e os HTTP. Antigamente, os servidores FTP costumavam ser mais rápidos.