Big Data – Eles sabem tudo sobre você


Grandes Dados – O que você precisa saber à respeito

Big Data – Conjunto de grandes dados armazenados. Por definição não explica muita coisa, mas hoje a vida de todos está guardada nas nuvens.

Embora não seja um assunto tão novo, Big Data refere-se ao conjunto de dados que praticamente todas as grandes empresas online estão guardando à seu respeito. Postou uma foto? Vai para lá. Recebeu ou escreveu um e-mail? Vai para lá. Cadastrou-se num site de culinária? Vai também. OK, meus dados tem que estar em algum lugar então o que Big Data tem de especial? Bom, o Google obviamente não inventou mas com certeza mostrou como se faz a  publicidade online. Ou seja, a máquina de pesquisas joga de uma maneira muito peculiar a forma de fazer isso. Existem outros buscadores, como o DuckDuckGo (que nome estranho?) que tem como bandeira não utilizar os seus dados para aprimorar a pesquisa – também conhecido como rastrear – mas têm um significância  relevante de resultados nas buscas.

O Google sabe tudo sobre você. Se você tem um smartphone com Android, usa o Gmail, YouTube, ou qualquer outro serviço deles, todas as buscas que fizer irão trazer resultados altamente significantes em função dele conhecer muito à seu respeito e isso é Big Data.

Muitas pessoas ficariam perpléxas surpresas com a informação acima. E já por diversas vezes fiz testes altamente específicos que comprovam essa afirmação, se eu for pesquisar por pizza, ele já me trará sugestões como “A melhor pizza de quatro queijos da região”. Isso porque ele já sabe que a minha preferida é de quatro queijos e evidentemente também sabe exatamente aonde estou.

Confesso que sou um dependente tecnológico do Google e de seus produtos. Já tentei não ser mas é difícil não se encantar pela cordialidade dos seus produtos. Afinal, pra que serve uma busca de coisas irrelevantes se ele me entrega rapidamente exatamente o que eu preciso/gosto/uso/conheço ?

OK, não precisa responder porque já sei a resposta. Mal posso esperar existir carro do Google que a hora que saio do serviço ele está me esperando na porta e ele já saiba exatamente para onde vou – se for para casa, para o supermercado ou um happyhour – sem precisar tomar nenhuma ação para isso…

Isso tudo é mágico mas…Tem um enorme porém! Se ele sabe tudo sobre mim e usa para o (meu) bem e de repente se essa informação fosse parar em mãos erradas? Isso deve valer muito dinheiro então tem que estar bem guardada, de preferência em um local que eu possa escolher por achar mais seguro. Bom isso não existe, eles decidem por você 😦 . E ainda, a maioria das pessoas podem não achar que eles devam ter toda essa informação. Pessoas que prefeririam escolher o que será acessível para eles e ainda o que eles podem guardar de informação. Isso também ainda não existe porque não pensaram numa legislação que controlasse as empresas de guardarem dados. Apoiamos apenas nas leis já existentes que são superficiais na questão de sigilosidade de dados, afinal para o entendimento atual, se o dado não for “registrado”, como você pode exigir propriedade? Como vou entrar na justiça e processar o Google por guardar a informação de que gosto de pizza de quatro queijos?

Nos EUA, existe o  “reasonable expectation of privacy” (expectativa razoável de privacidade) que foi o que imaginaram sobre privacidade e tecnologia para os cidadãos americanos, mas trata-se de uma lei local, que não garante cumprimento em outros países. A União Europeia por sua vez, está trabalhando na  General Data Protection Regulation (regulamentação geral de proteção de dados) para ser implementada em 2018 que abrangerá muito mais do que a REoP (americana) e trará 2 pontos principais : 1) Abrangerá os dados relativos aos cidadãos europeus, independentemente de onde serão armazenados. 2) Poder de escolha do que (e se) dados poderão ser transformados em Big Data. Vamos esperar para ver como isso afetará o mundo.

Por aqui no Brasil ainda nossos legisladores não conseguiram nem exigir as leis relativas ao Marco Civil da Internet, mas acredito que globalmente possamos ser beneficiados de alguma maneira.

Só nos resta esperar.

Bom enquanto isso vou ali no Google buscar por uma pizza…

Tio Cláudio


banner

Gostaria de opinar sobre os serviços de hospedagem disponíveis atualmente no Brasil que vem se modificado e deixando muita gente chateada.

Vamos falar um pouco de história

Bem pouco tempo atrás, começou assim o serviço de hospedagem : o servidor era físico e evidentemente ligado em alguns poucos datacenters que compartilhavam hospedagem de sites.

Como não se podia prever quais vizinhos estavam no mesmo servidor que você, existia uma falta de padrão nos serviços prestados com muitas interrupções, lentidões e perda de dados.

Isso foi assim desde o final dos anos 90 até os anos 2000…

À partir de 2002 mais ou menos serviços de servidores dedicados começaram a ser oferecidos pelos provedores e assim – embora com o custo alto – você poderia ter privacidade e maior estabilidade.

acessar_rack_datacenter

Realmente esse período foi interessante porque dependendo do seu contrato você poderia visitar um datacenter e realizar uma intervenção fisicamente nele, o que era bem legal

Mas rapidamente esse tipo de serviço parou de ser oferecido em troca dos servidores dedicados compartilhados. Sim compartilhados!

Tive contato com muitos consultores e técnicos de datacenter e conheci como é feita a matemática da hospedagem.

No final dos anos 2000 começaram a ser oferecidos os servidores virtualizados (VPS), que criavam uma instância para seu uso, ou seja criam uma camada de isolação virtual entre as instâncias e limitando via software se assegura que o uso de cada hospedagem não afeta a próxima como ocorria nos servidores dedicados.

Isso funcionou muito bem tendo algumas empresas brasileiras que investiram nisso e prestaram bons serviços, apesar do custo ser relativamente baixo. Até hoje ainda é possível encontrar esse serviço à disposição.

Logo, de 2010 em diante criou a popularidade o famoso serviço cloudnas nuvens – que definitivamente iniciou a ruína de bons serviços disponíveis. Para começar, tecnicamente todo servidor virtualizado significa que está no cloud, porque está em muitos lugares simultaneamente na internet. Imaginem um datacenter com vários servidores conectados com um sistema de gerenciamento de virtualização – conhecido como pool – que faz com que todos os hardwares se unam, gerando um mega-computador e nele milhares de instâncias de hospedagens de servidores virtualizados.

Sim isso é o real significado de cloud.

A principal vantagem dessa configuração é que caso um hardware em específico como um pente de memória ou um hd venha a dar problema, ao invés de parar o serviço  todo apenas diminui insignificantemente a potência total desse cloud, por exemplo se tiver 1000 servidores num pool e um parar, apenas 0,001% de processamento à menos será impactado. Isso é mágica!

Mas tem um porém – ahhh – sim tem um porém. Claro que as empresas não perderiam a chance de agregar lucratividade nesse sistema, afinal ele é o mais interessante de hospedagem. Simplesmente para diferenciar do antigo serviço VPS criaram uma forma diferente de cobrança : servir e entregar um servidor virtual com suas configurações fixas (quantidade de RAM, de Cores, de espaço em disco) permitiram configurações flexíveis que possam ser modificadas à qualquer momento e cobrando proporcionalmente ao escolhido.

Como tudo nessa vida, tem prós e contra esse tipo de cobrança, vamos lá :

PRÓS

  • optimização de capacidade
  • possibilidade de mudança por demanda
  • alta escalabilidade
  • modificações sazonais

CONTRA

  • dificuldade de estimativa de custos
  • variação brusca de cobrança
  • super ou sub dimensionamento acidental
  • oferta de pacotes pode ser mudada a qualquer momento

 

E como está hoje?

 

mega-datacenter

Mas o cloud hoje sofre uma nova ameaça : a globalização. Não demorou para as empresas de hospedagem perceberem que essa virtualização poderia ser pulverizada, que poderia estar em mais de um lugar. Logo, ao invés de trazer recursos para o Brasil, ocorreu o inverso. Em países como Índia, Estados Unidos e alguns remotos da Europa foram construídos mega-datacenters. Verdadeiras cidades com milhares de servidores virtualizados oferecendo revenda para outros datacenters – agora virtuais – à um custo x benefício imbatíveis e causando uma concorrência desleal no serviço.

Como a maioria das hospedagens servem apenas para sites, não faz muita diferença – ou não é sensivelmente sentida pelos clientes – o tempo de resposta no serviço. Ou seja, se uma página demorar 150ms ao invés de 25ms fará muito impacto aos olhos dos clientes –   mas o valor da hospedagem cai sensivelmente.

Isso dificulta – e as vezes impossibilita – que pequenos desenvolvedores possam utilizar sistemas simples de hospedagem para rodar sistemas web (php?) porque além de lentos, podem ser muito falhos na entrega de pacotes. E isso afeta diretamente a qualidade do serviço oferecido como sistema.

Essa alta escalabilidade está sendo sentida também em serviços de grande porte. Recentemente, com a simples interrupção de alguns serviços da amazon.com cerca de 1/3 (1/3!!!) da internet saiu fora do ar por algumas horas.

Isso causou um enorme mau estar em muitas empresas e alguns criadores de opiniões começaram a se perguntar se é realmente necessária tanta exportação/migração de dados de servidores internos para o cloud.

Essa semana – com muita estranheza, confesso – a Microsoft anunciou que está migrando todo o código fonte do Windows – cerca de 300 Gb – para o Git (sistema de controle de versão distribuído). Não faz muito sentido, afinal eles oferecem o serviço Azure e outros na nuvem e poderiam criar seu próprio git sem necessidade de utilizar serviços terceiros…

vai entender?

Wi-Fi é Seguro? Como derrubar uma rede sem invadir.


Neste novo vídeo, trouxe à tona um tema que já fazia tempo que eu queria abordar : A segurança no uso comum do wi-fi

Não é de hoje que a rede sem fio – como é conhecida no Brasil – entrou em nossos lares e escritórios e na verdade, está presente em todos os lugares. E isso pode trazer um problema invisível mas também onipresente : a falta de segurança.

E não é só isso, mesmo que não haja uma invasão propriamente dita, existe a possibilidade de ser interrompida, de ser “atrapalhada” no seu funcionamento, na necessidade de comunicação entre equipamentos.

Popularizou-se por ser uma conexão expressa – você compra um roteador e liga na tomada e pronto, tem uma rede ao alcance – mas ela é confiável? Posso aposentar meu cabeamento de rede e ficar só com ela?

Então resolvi fazer esse vídeo para elucidar as pessoas sobre os pontos de falha mais comuns e, por que não? Avisar aos usuários que ela não é 100%.

Como funciona uma Fábrica de Software?


code-944499_1280

Também conhecidas como software houses, as Fábricas de Software elevaram o desenvolvimento de software à um novo patamar.

Podemos considerar que o Desenvolvimento de Software evolui tanto quanto as tecnologias aplicadas na área mas que consideravelmente não mudavam muito na sua essência, pois empresas desenvolvedoras adotavam um formato acadêmico e até porque não, escolares. Tinham vários programadores trancados em uma sala com um gerente de projetos à frente “ditando” o que a classe deveria fazer, inclusive escrevendo em uma lousa.

Mas isso mudou e mudou muito. Mesmo grandes corporações estão adotando vários formatos e configurações de modo de desenvolvimento, tornando tudo muito mais confortável para o programador que passou a chamar desenvolvedor e tendo muito mais liberdade na forma de administrar seu tempo e trabalho.

Podemos deusb-connection-1242900-638x427stacar a adoção dos home-office, horários totalmente livres, a decisão na escolha de jobs conforme afinidade de cada desenvolvedor, liberdade de escolha de ferramentas de desenvolvimento, IDEs e de métodos de trabalho. Hoje as reuniões são praticamente semanais ou feitas para o briefing de cada etapa de projeto. Outras ferramentas de apoio também estão sendo bem utilizadas como os mindmaps, portais colaborativos, comunidades, redes sociais e blogs de desenvolvimento. A regra agora é o networking entre os desenvolvedores.

As Fábricas de Software são empresas que adotam todos esses novos métodos e formam equipes de desenvolvedores motivados e com total liberdade, devendo apenas ter a responsabilidade e entregar o job no prazo estipulado com todos os requisitos atribuídos no projeto.usb-cable-1-1242560-639x426

Isso torna o relacionamento entre o cliente e a fábrica de software mais humano e gera resultados imediatos de produtividade e qualidade. Com isso reduzem-se custos e tempo de entrega de produtos possibilitando contratos duradouros.

As Fábricas de Software tem total flexibilidade para fechar contratos pois tem muitos profissionais a disposição com o expertise necessário em projetos dinâmicos e modernos conforme o mercado pede.

Porque o SEO faz diferença para seu site?


Desde quando o Google é Google, aparecer nas pesquisas em uma posição privilegiada é uma questão de honra para qualquer site que queira tornar-se relevante no mundo digital.

Conseguir isso, não é uma tarefa muito fácil pois exige estudo, técnica, paciência e o principal : Apoio de um profissional qualificado para executar apropriadamente todas as etapas desse trabalho.

Mas afinal, o que é SEO?

SEO é uma sigla que significa Optimização no Motor de Buscas. Continua meio vago para quem não é da área, e até causa muitas dúvidas para quem é em entender o significado exatamente.

Eu explico, vamos lá :

Quando dizemos buscas (Search) descreve o ato ou ação de digitar um termo, texto, palavra ou sigla em um campo de pesquisas – uma caixa de textos – que por sua vez, utiliza-se de um programa ou algorítimo (Engine) que procura em seu banco de dados indexado os resultados de maior relevância e contexto para o que foi procurado. Isso efetivamente é simples no conceito e no uso, mas o que tem por trás da telinha é extremamente complexo. Para começar, o que determina a relevância para compilar a ordem de exibição dos resultados combina dezenas de fatores para então formular a lista de resultados. Combinado à isso, os buscadores – como são chamados os sites de buscas como o Google, Bing, etc – trabalham com anúncios pagos, o que lhes gera renda para que a busca em si seja gratuita. Teoricamente e até um certo ponto, quem paga mais aparece primeiro – mas o $$$ não é o único fator – e por essa ação chamamos de leilão. O leilão também é um processo complexo, que envolve não apenas dinheiro mas a qualidade, padronização e principalmente optimização do site. Essa optimização faz a terceira letra (Optimize) e é nela que entram os Especialistas em SEO. Essa optimização é muito bem organizada e estruturada e para isso exige uma série de critérios e informações específicas para surtirem resultado. Os anúncios gratuitos exibidos na lista abaixo dos pagos são conhecidos por Orgânicos. O conjunto de diretivas para decidir quais anúncios aparecem nos pagos e quais nos orgânicos é chamado de leilão e, acreditem não é o valor por clique o único fator nessa ordem…

type-away

Ufa quanta coisa, não é mesmo? Pois é, isso ainda eu apenas pincelei a parte mais compreensível de um trabalho de SEO. Para entender e ser um especialista, é necessário muito tempo de pesquisa, experiência e há ainda cursos específicos de treinamento do assunto incluindo até avaliação.

Cada caso é um caso, e cada site é um site. Para cada proposta de divulgação de um site é necessário que o Especialista SEO examine minunciosamente o site, faça levantamento de requisitos e de termos de anúncios, crie e administre campanhas de publicidade como o AD Words do Google e após um tempos os motores de busca começarão a destacar seu site nas pesquisas.

Caso queira uma avaliação de seu site, como está seu SEO e dicas do que pode ser melhorado, acesse esse site para entrar em contato :

http://www.crg.net.br

Também aproveite para entrar na página de serviços que detalha muitas especialidades e compromissos com os clientes.

Na CRGNET Informática, não fazem apenas serviços, entregam soluções aos clientes.

Agradecemos pelo interesse.