Que os dados, hoje, valem mais que petróleo, não é novidade alguma. Mas, sozinhos, não garantem as melhores performances de uma empresa. O debate, assim, gira em torno da maneira mais eficaz de interpretar, gerir e transformar estes dados em prol do negócio. Afinal, um bom gerenciamento é capaz de manejar e contextualizar os dados, extraindo informações relevantes que serão úteis na tomada de decisões de uma organização.
Victor Pontes, cientista de dados do PicPay, fala sobre a importância da jornada de dados, sobre erros e soluções envolvidas no processo e do futuro desta área.
Entretanto, o cuidado com a gestão de dados, tão importante para os resultados de uma empresa, nem sempre acontece. Muitas vezes, a falta de estruturas claras no gerenciamento das informações, de habilidades profissionais ou, até mesmo, a pressa em expandir os negócios podem colocar tudo em risco. Para entender melhor a importância da jornada de dados, bem como os erros — e as soluções! — envolvidos neste processo, conversamos com o cientista de dados do PicPay, Victor Pontes, que também fala do futuro desta área.
Em um mundo que gera um volume exorbitante de dados todos os dias, nem sempre é fácil filtrar e administrar as informações obtidas em prol dos negócios. Como os dados podem ser transformados em matéria-prima útil para uma empresa de maneira mais eficaz?
Quando nos deparamos com um simples produto de dados final, tais como dashboards, relatórios analíticos, experimentos, dificilmente paramos para pensar no fluxo de dados desde sua extração. Fato é que para construirmos qualquer um desses produtos, precisamos dispor de uma plataforma de dados bem estabelecida e gerenciada. Para uma organização alcançar esse nível de maturidade, é necessário investir fortemente em times de infraestrutura de dados.
Quais os maiores desafios dos cientistas e analistas de dados atualmente?
Sobre a atividade desses profissionais, muito se questiona sobre aspectos técnicos e hard skills em geral. Particularmente, acredito que os principais desafios estão no contexto de soft skills: entender e se comunicar bem com as áreas de negócios, proatividade e visão para conseguir encontrar oportunidades em que algum produto de dados possa ser aplicado, bem como vender e evangelizar os produtos de dados internamente. Existe uma lacuna muito clara entre os dados e ações em se tratando do negócio. Cabe a esses profissionais juntar as duas pontas.
Quais são os erros mais comuns das empresas na obtenção, na gestão e na transformação de seus dados em informações úteis ao negócio? Por que acontecem?
No mundo real, nem tudo é sinal, sempre haverá ruído residual. Ou seja, entenda como "sinal" os dados e informação pura ou exata. O ruído é todo o lixo ou dados incorretos que surgem no processo, isso sempre vai acontecer. Pensando em broadcast como rádio, por exemplo, a informação é transmitida por redes de transmissão, mas sempre trás consigo o ruído que, se for residual, pode ser tratado. O mesmo acontece com dados de um software ou organização complexa. Esta é uma realidade que os mais iniciantes têm dificuldades em aceitar, mas é impossível garantir a exatidão em todo o fluxo de dados em uma organização ou software complexo. Apesar disso, é possível mapear os principais fluxos de dados e garantir sua qualidade, segundo padrões preestabelecidos. Chamamos isso de Governança de Dados, e é justamente nesse ponto em que a maioria das organizações erram, muitas vezes, como resultado do imediatismo dos objetivos de negócios. Em alguns lugares por onde passei na minha carreira, pude viver algumas situações indesejáveis: múltiplas fontes de dados sobre um mesmo contexto que não concordavam entre si e confundiam times de negócios e cargas que mudavam de estrutura sem nenhuma previsibilidade, quebrando processos dependentes.
O que estes equívocos podem acarretar para os negócios?
A falta de políticas e processos bem definidos e aplicados de governança de dados gera diversos problemas, como falta de segurança e de confiabilidade, além de afetar o entendimento do negócio, de saber quais são os dados disponíveis, como encontrá-los e utilizá-los em produtos finais. Vários outros problemas derivam destes, tais como a duplicação de trabalho de geração de banco de datasets, análises equivalentes que não concordam entre si, sobrecarga de plataforma de dados, entre outros.
Que medidas podem ser tomadas para corrigir esses erros?
Estabelecer fortes padrões de governança de dados dentro de uma instituição não é nada fácil, é preciso um processo de aculturação para que as políticas sejam de fato praticadas e não sejam apenas "para inglês ver". O processo é longo e envolve várias questões substanciais, tais como considerar os dados como ativo de negócio, optar sempre pela qualidade e não quantidade de entregas, senso de dono, espírito colaborativo e uma boa dose de cobrança por padronização.
O que existe hoje no mercado, em termos de ferramentas tecnológicas e serviços, que podem contribuir com a jornada de dados?
Como costumo dizer, a Governança de Dados é uma área extremamente ampla, existem diversas ferramentas que podem auxiliar em atividades específicas como nas questões de gestão de qualidade de dados. Todavia, gostaria de ressaltar que essa área é muito técnica e humana, ao mesmo tempo, e que a principal ferramenta é a cultura de dados estabelecida na empresa. A questão principal é entender o contexto da organização, escolher bem os ambientes de big data e de computação em nuvem, construir uma arquitetura de dados eficiente para orquestrar cada uma das pontas e, aos poucos, estabelecer políticas de governança de dados.
Como você vê o “manuseio” da informação no futuro? O que há hoje, em termos de aprimoramentos, que pode impactar na gestão de dados?
Eu enxergo o presente como período global de amadurecimento das organizações no que se refere à gestão e extração de valor dos dados. Diria que em todo o globo, apenas algumas dezenas de instituições alcançaram a maturidade em dados e isso passa fortemente pela cultura e governança de dados. Dessa forma, eu consigo vislumbrar um futuro — não muito distante e que leva em conta o grande volume de dados e a alta incidência de normas e leis que já temos — em que a maturidade em Governança de Dados, ainda restrita, será mandatória para a sobrevivência de toda instituição.
Divisão do Grupo Orange dedicada ao universo B2B, a Orange Business é um fornecedor global de serviços de TI e comunicações, posicionado estrategicamente para permitir que a transformação digital ocorra de forma fluida, garantindo o maior ganho possível para seus clientes, independentemente dos setores nos quais operem.