A empresa escolhida para propôr e construir a solução para o UC Potencial de Vendas vs Disponibilidade de Rede foi a A3Data. A parceria foi formalizada a partir da proposta enviada pela empresa. A parceria se deu por '''Risk Sharing''' dos resultados, ou seja, acordos de partilha de riscos. O modelo de risk sharing permite o acesso a uma tecnologia, de acordo com certas condições. Tal modelo pode usar diversos mecanismos para tratar da incerteza sobre o desempenho da tecnologia, para maximizar seu uso ou, ainda, minimizar seu impacto financeiro.
</div>
<div>
[[Arquivo:A3dataparceria.JPG|700px|thumb|center|Solução apresentada pela A3Data]]
Chung-min Chen. Use cases and challenges in telecom big data analytics. 2015
Fase II - Ensino
Conteúdo e Apresentação
Metodologia
Fase III - Exemplo de Caso de Negócio
Product Backlog
Benefícios para quem for oferecer esta solução
Benefícios para o usuário
Direcionadores chave para esta iniciativa
Possíveis modelos de negócios
Business Case
Alinhamento com Lei do Bem
Projeto possui algum elemento tecnologicamente novo ou inovador?
Projeto possui barreira ou desafio tecnológico superável?
Projeto utiliza metodologia/método para superação da barreira ou desafio tecnológico?
Projeto é desenvolvido em parceira com alguma instituição acadêmica, ICT ou startup?
Fase IV - Protótipo orientado ao Negócio
Escopo
Limitações
PoC
Detalhamento Técnico
Clusterização:
Para rodar o Modelo de Regressão Multinível, através da linguagem Python e de suas bibliotecas de análises de dados, foi necessário o preparo e classificação dos dados de rede e socio-econômicos referentes aos Setores Censitários (área de referência utilizada no estudo). Uma parte desse processo de preparo foi a clusterização, ou seja, definição de clusters ou grupos de setores de características semelhantes como quantidade de cliente GPON/Banda Larga, quantidade de clientes que pediram upgrade e outras.
Rodando o modelo:
Importando as bibliotecas necessáriasLendo e tratando os dados de inputGerando a saída
Saída do Modelo:
Foram definidos 7 clusters de acordo com o Elbow Graph do conjunto de dados. Com todos os dados e classificação dos setores, foram definidas as features ou características mais importantes para o estudo e então, tais features foram usadas como input no Modelo Multinível. O modelo retornou um número de -3 a 3 para cada setor, tais números representam o potencial de vendas e exploração em cada local. É importante destacar que o modelo exige treino e é feito trimestralmente, ou seja, ele deve ser refeito periodicamente, tanto para trazer confiabilidade às saídas, quanto para acompanhar as mudanças realizadas na rede e/ou ações realizadas pelo comercial.
A imagem mostra alguns dos dados de saída do modelo, com destaque para a classe do setor, de acordo com seu potencial e a classe_sc, referente ao cluster em que aquele setor está inserido
Mapeamento:
Com a execução do modelo estatístico e, como consequência, garantia dos resultados de potencial vendas (preditos por meio da entrada, no modelo, de diversos dados referentes aos setores censitários), é possível agregar tais resultados ao estado de disponibilidade de rede em uma mapa. O esboço desse mapa pode ser visto na imagem abaixo:
Erro ao criar miniatura: Arquivo não encontradoÀ esquerda são mostrados os filtros possíveis. No centro, o mapa com a delimitação de bairros, setores censitários e sua classificação quanto ao potencial, sendo as classes negativas pouco exploradas, de acordo com o modelo. À direita, os KPIs mostram a soma dos potenciais negativos e uma lista dos potenciais de cada setor censitário em ordem crescente
À esquerda são mostrados os filtros possíveis, com uma coloração diferente para diminuir o impacto visual do dashboard. No centro, o mapa com a delimitação de bairros, setores censitários e sua classificação quanto ao potencial, de acordo com o modelo. É possível notar na legenda que alguns indicadores de ocupação de banda larga do setor já estão dispostos no mapa.
Cronograma Macro
Histórico
02/03/2020: Marcação de alinhamento com o especialista Henrique Omena para discussão do tópico;
03/03/2020: Início da escrita do Conceito;
06/03/2020: Alinhamento marcado para 10/03;
11/03/2020: Refinamento do Conceito, início das características e listagem dos tópicos do estudo dirigido;
12/03/2020: Refinamento do Conceito;
18/03/2020: Criação de apresentação da Fase 2;
25/03/2020: Refinamento da apresentação;
26/03/2020: Início da escrita da Fase 3 e ponto de controle realizado com especialista, o qual apontou modificações e próximos passos para o desenvolvimento da PoC;
30/03/2020: Continuação da escrita da Fase 3 e ponto de controle marcado para 02/04 com o Luiz Cláudio;
31/03/2020: Término da Fase 3;
06/04/2020: Apresentações realizadas para o especialista e Luiz Cláudio nos últimos dias. Realização de revisão bibliográfica para embasar melhor a teoria;
09/04/2020: Início: desenvolvimento de esboço do Dashboard de apoio ao projeto;
13/04/2020: Esboço do Dashboard de apoio ao projeto finalizado;
23/04/2020: Edição de fase III para adequação ao que deve ser escrito;
27/04/2020: Adição de Business Case em Telco Analytics;
28/04/2020: Adição de Business Case em Telco Analytics;
04/05/2020: Trabalho no UC referente à PoC;
12/05/2020: Continuação trabalho no UC referente à PoC: cálculo dos indicadores de disponibilidade de rede para validação do modelo;
15/05/2020: Continuação trabalho no UC referente à PoC: cálculo dos indicadores de disponibilidade de rede para validação do modelo;
19/05/2020: Adição de recursos no Dashboard para filtragem de acordo com métricas de disponibilidade de rede sugeridos por Henrique Omena, como por exemplo, número de portas ocupadas por domicílios e etc. A visão auxiliará a equipe do comercial a definir frente de vendas no futuro. O output dos indicadores será usado para testes estatístico, visando melhor entendimento dos dados;
20/05/2020: Início da escrita do detalhamento técnico: adição do esboço do dashboard e uma breve legenda na imagem;
21/05/2020: Discussão com especialista sobre o processo de levantamento e tratamento de dados e aplicação do modelo multinível (preditivo) para previsão do potencial de vendas dos setores;
22/05/2020: Detalhamento técnico sobre a aplicação do modelo preditivo para retorno do potencial de vendas do setores censitários: clusterização e saída do modelo;
25/05/2020: Aguardando aprovação de acesso ao banco Redshift para acesso à base ativa de clientes;
26/05/2020: Inserção da base ativa no dashboard. A intenção é inserir os últimos indicadores de disponibilidade de rede e aperfeiçoar o layout do dashboard para apresentar para o comercial. O aperfeiçoamento foi iniciado visando melhorias no layout e usabilidade do dashboard;
28/05/2020: Apresentação do esboço para a equipe de marketing. Foram discutidas as lógicas de uso do dashboard e, nesse sentido, a necessidade de aplicar filtros para agilizar o processo de análise dos setores censitários;
01/06/2020: Reunião para entender como se deu a parceria com a empresa A3Data. Início da escrita sobre a parceria;
02/06/2020: Adição de partes do código em Python responsável por executar o modelo preditivo de Potencial de Vendas, de acordo com os features selecionados dos setores censitários;
05/06/2020: Reunião para discussão do layout do Dashboard com o Marketing;
08/06/2020: Na reunião da sexta passada, com o Talvane da equipe de Marketing, foram definidas as próximas alterações no dashboard e a necessidade de criar um ranking de setores censitários, de acordo com suas características. Além disso, foi marcada uma reunião para normalização e tratamento dos dados para garantir maior confiabilidade nos resultados mostrados no dashboard;
12/06/2020: Reunião com o marketing: definição das regras para ranqueamento dos setores, visando definir as ações de mailing que acontecerão na próxima semana. Fiquei responsável por: atualizar o dashboard com os dados atualizados para o Geofusion e o modelo. Além disso, criar a visão de ranqueamento, o qual dará uma nota total dependente das características de potencial e rede. Com o orçamento definido, será possível definir quais os principais setores são mais rentáveis para a ampliação da rede.
23/06/2020: Término da escrita da parte 1 de desenvolvimento do projeto. A parte 2 será preenchida à medida que: os planos/testes de mailing resultantes do relatório output do dashboard sejam feitos e o dashboard seja atualizado;
17/07/2020: Necessidade de criação de nova fase para evolução da Telco Analytics. A intenção é apontar os caminhos para a evolução para Projeto;
21/07/2020: Em contato com Ravi, ele informou que uma maneira de calcular ou avaliar o retorno financeiro de decisões baseadas em dados é realizar Testes A/B. Além disso, após pesquisas, descobri que existe o Teste Multivariado (MVT), que leva em conta mais variáveis para medir a influência das mesmas no retorno financeiro. O teste A/B já é previsto para a próxima etapa do UC Potencial de Vendas.
23/07/2020: Retomada de UC: atividades a serem realizadas - estudo para validar base de clientes + disponibilizar informação de clientes para mailing nas listagens
28/07/2020: Verificação consistência contagem Banda Larga ( GPON e Legado) pela base ativa e associação com Setor Censitário. Foi também criado um cronograma para as próximas ativiades do UC
2) Potencial de Vendas x Disponibilidade Rede GPON - Esse que o Arthur estava. Modelo finalizado e falta a entrega do DASH ( Otimização do Dash, tabelas e homologação para entrega)
3) Padrão de OS - Probabilidade de Repetição OS : Esse está nas ultimas sprints ( deployment do modelo no ambiente)
10/12/2020: Kick-Off com Pedro Teixeira
11/12/2020: Alinhamento com Arthur e Matheus sobre Telco Analytics
17/12/2020: Kick-off com Arthur e Luiz Cláudio. Conhecimentos a adquirir: Python, Banco de Dados e Spotfire