Linha 71: Linha 71:


== PoC  ==
== PoC  ==
<div style='text-align:justify'>
A empresa escolhida para propôr e construir a solução para o UC Potencial de Vendas vs Disponibilidade de Rede foi a A3Data. A parceria foi formalizada a partir da proposta enviada pela empresa. A parceria se deu por '''Risk Sharing''' dos resultados, ou seja, acordos de partilha de riscos. O modelo de risk sharing permite o acesso a uma tecnologia, de acordo com certas condições. Tal modelo pode usar diversos mecanismos para tratar da incerteza sobre o desempenho da tecnologia, para maximizar seu uso ou, ainda, minimizar seu impacto financeiro.
</div>
<div>
[[Arquivo:A3dataparceria.JPG|700px|thumb|center|Solução apresentada pela A3Data]]
</div>
<div>
</div>


== Detalhamento Técnico  ==
== Detalhamento Técnico  ==

Edição das 18h59min de 5 de julho de 2021

Fase I - Estudo


Título da Idéia

CX TR-069

Objetivos

Conceito

Características 

Estudo Dirigido

Referências Bibliográficas

  • Chung-min Chen. Use cases and challenges in telecom big data analytics. 2015

Fase II - Ensino


Conteúdo e Apresentação

Metodologia

Fase III - Exemplo de Caso de Negócio


Product Backlog

Benefícios para quem for oferecer esta solução

Benefícios para o usuário

Direcionadores chave para esta iniciativa

Possíveis modelos de negócios

Business Case

Alinhamento com Lei do Bem

  • Projeto possui algum elemento tecnologicamente novo ou inovador?
  • Projeto possui barreira ou desafio tecnológico superável?
  • Projeto utiliza metodologia/método para superação da barreira ou desafio tecnológico?
  • Projeto é desenvolvido em parceira com alguma instituição acadêmica, ICT ou startup?

Fase IV - Protótipo orientado ao Negócio


Escopo

Limitações

PoC

Detalhamento Técnico

Clusterização:

Para rodar o Modelo de Regressão Multinível, através da linguagem Python e de suas bibliotecas de análises de dados, foi necessário o preparo e classificação dos dados de rede e socio-econômicos referentes aos Setores Censitários (área de referência utilizada no estudo). Uma parte desse processo de preparo foi a clusterização, ou seja, definição de clusters ou grupos de setores de características semelhantes como quantidade de cliente GPON/Banda Larga, quantidade de clientes que pediram upgrade e outras.

Rodando o modelo:

Importando as bibliotecas necessárias
Lendo e tratando os dados de input
Gerando a saída

Saída do Modelo:

Foram definidos 7 clusters de acordo com o Elbow Graph do conjunto de dados. Com todos os dados e classificação dos setores, foram definidas as features ou características mais importantes para o estudo e então, tais features foram usadas como input no Modelo Multinível. O modelo retornou um número de -3 a 3 para cada setor, tais números representam o potencial de vendas e exploração em cada local. É importante destacar que o modelo exige treino e é feito trimestralmente, ou seja, ele deve ser refeito periodicamente, tanto para trazer confiabilidade às saídas, quanto para acompanhar as mudanças realizadas na rede e/ou ações realizadas pelo comercial.

A imagem mostra alguns dos dados de saída do modelo, com destaque para a classe do setor, de acordo com seu potencial e a classe_sc, referente ao cluster em que aquele setor está inserido

Mapeamento:

Com a execução do modelo estatístico e, como consequência, garantia dos resultados de potencial vendas (preditos por meio da entrada, no modelo, de diversos dados referentes aos setores censitários), é possível agregar tais resultados ao estado de disponibilidade de rede em uma mapa. O esboço desse mapa pode ser visto na imagem abaixo:

Erro ao criar miniatura: Arquivo não encontrado
À esquerda são mostrados os filtros possíveis. No centro, o mapa com a delimitação de bairros, setores censitários e sua classificação quanto ao potencial, sendo as classes negativas pouco exploradas, de acordo com o modelo. À direita, os KPIs mostram a soma dos potenciais negativos e uma lista dos potenciais de cada setor censitário em ordem crescente
À esquerda são mostrados os filtros possíveis, com uma coloração diferente para diminuir o impacto visual do dashboard. No centro, o mapa com a delimitação de bairros, setores censitários e sua classificação quanto ao potencial, de acordo com o modelo. É possível notar na legenda que alguns indicadores de ocupação de banda larga do setor já estão dispostos no mapa.

Cronograma Macro


Histórico

  • 02/03/2020: Marcação de alinhamento com o especialista Henrique Omena para discussão do tópico;
  • 03/03/2020: Início da escrita do Conceito;
  • 06/03/2020: Alinhamento marcado para 10/03;
  • 11/03/2020: Refinamento do Conceito, início das características e listagem dos tópicos do estudo dirigido;
  • 12/03/2020: Refinamento do Conceito;
  • 18/03/2020: Criação de apresentação da Fase 2;
  • 25/03/2020: Refinamento da apresentação;
  • 26/03/2020: Início da escrita da Fase 3 e ponto de controle realizado com especialista, o qual apontou modificações e próximos passos para o desenvolvimento da PoC;
  • 30/03/2020: Continuação da escrita da Fase 3 e ponto de controle marcado para 02/04 com o Luiz Cláudio;
  • 31/03/2020: Término da Fase 3;
  • 06/04/2020: Apresentações realizadas para o especialista e Luiz Cláudio nos últimos dias. Realização de revisão bibliográfica para embasar melhor a teoria;
  • 09/04/2020: Início: desenvolvimento de esboço do Dashboard de apoio ao projeto;
  • 13/04/2020: Esboço do Dashboard de apoio ao projeto finalizado;
  • 23/04/2020: Edição de fase III para adequação ao que deve ser escrito;
  • 27/04/2020: Adição de Business Case em Telco Analytics;
  • 28/04/2020: Adição de Business Case em Telco Analytics;
  • 04/05/2020: Trabalho no UC referente à PoC;
  • 12/05/2020: Continuação trabalho no UC referente à PoC: cálculo dos indicadores de disponibilidade de rede para validação do modelo;
  • 15/05/2020: Continuação trabalho no UC referente à PoC: cálculo dos indicadores de disponibilidade de rede para validação do modelo;
  • 19/05/2020: Adição de recursos no Dashboard para filtragem de acordo com métricas de disponibilidade de rede sugeridos por Henrique Omena, como por exemplo, número de portas ocupadas por domicílios e etc. A visão auxiliará a equipe do comercial a definir frente de vendas no futuro. O output dos indicadores será usado para testes estatístico, visando melhor entendimento dos dados;
  • 20/05/2020: Início da escrita do detalhamento técnico: adição do esboço do dashboard e uma breve legenda na imagem;
  • 21/05/2020: Discussão com especialista sobre o processo de levantamento e tratamento de dados e aplicação do modelo multinível (preditivo) para previsão do potencial de vendas dos setores;
  • 22/05/2020: Detalhamento técnico sobre a aplicação do modelo preditivo para retorno do potencial de vendas do setores censitários: clusterização e saída do modelo;
  • 25/05/2020: Aguardando aprovação de acesso ao banco Redshift para acesso à base ativa de clientes;
  • 26/05/2020: Inserção da base ativa no dashboard. A intenção é inserir os últimos indicadores de disponibilidade de rede e aperfeiçoar o layout do dashboard para apresentar para o comercial. O aperfeiçoamento foi iniciado visando melhorias no layout e usabilidade do dashboard;
  • 28/05/2020: Apresentação do esboço para a equipe de marketing. Foram discutidas as lógicas de uso do dashboard e, nesse sentido, a necessidade de aplicar filtros para agilizar o processo de análise dos setores censitários;
  • 01/06/2020: Reunião para entender como se deu a parceria com a empresa A3Data. Início da escrita sobre a parceria;
  • 02/06/2020: Adição de partes do código em Python responsável por executar o modelo preditivo de Potencial de Vendas, de acordo com os features selecionados dos setores censitários;
  • 05/06/2020: Reunião para discussão do layout do Dashboard com o Marketing;
  • 08/06/2020: Na reunião da sexta passada, com o Talvane da equipe de Marketing, foram definidas as próximas alterações no dashboard e a necessidade de criar um ranking de setores censitários, de acordo com suas características. Além disso, foi marcada uma reunião para normalização e tratamento dos dados para garantir maior confiabilidade nos resultados mostrados no dashboard;
  • 12/06/2020: Reunião com o marketing: definição das regras para ranqueamento dos setores, visando definir as ações de mailing que acontecerão na próxima semana. Fiquei responsável por: atualizar o dashboard com os dados atualizados para o Geofusion e o modelo. Além disso, criar a visão de ranqueamento, o qual dará uma nota total dependente das características de potencial e rede. Com o orçamento definido, será possível definir quais os principais setores são mais rentáveis para a ampliação da rede.
  • 23/06/2020: Término da escrita da parte 1 de desenvolvimento do projeto. A parte 2 será preenchida à medida que: os planos/testes de mailing resultantes do relatório output do dashboard sejam feitos e o dashboard seja atualizado;
  • 17/07/2020: Necessidade de criação de nova fase para evolução da Telco Analytics. A intenção é apontar os caminhos para a evolução para Projeto;
  • 21/07/2020: Em contato com Ravi, ele informou que uma maneira de calcular ou avaliar o retorno financeiro de decisões baseadas em dados é realizar Testes A/B. Além disso, após pesquisas, descobri que existe o Teste Multivariado (MVT), que leva em conta mais variáveis para medir a influência das mesmas no retorno financeiro. O teste A/B já é previsto para a próxima etapa do UC Potencial de Vendas.
  • 23/07/2020: Retomada de UC: atividades a serem realizadas - estudo para validar base de clientes + disponibilizar informação de clientes para mailing nas listagens
  • 28/07/2020: Verificação consistência contagem Banda Larga ( GPON e Legado) pela base ativa e associação com Setor Censitário. Foi também criado um cronograma para as próximas ativiades do UC
  • Erro ao criar miniatura: Arquivo não encontrado
    Cronograma do UC: clique para melhor visualizar
  • 05/10/2020: Status ...
    • 1) Já Entregue - Capex ROI Based
    • 2) Potencial de Vendas x Disponibilidade Rede GPON - Esse que o Arthur estava. Modelo finalizado e falta a entrega do DASH ( Otimização do Dash, tabelas e homologação para entrega)
    • 3) Padrão de OS - Probabilidade de Repetição OS : Esse está nas ultimas sprints ( deployment do modelo no ambiente)
  • 10/12/2020: Kick-Off com Pedro Teixeira
  • 11/12/2020: Alinhamento com Arthur e Matheus sobre Telco Analytics
  • 17/12/2020: Kick-off com Arthur e Luiz Cláudio. Conhecimentos a adquirir: Python, Banco de Dados e Spotfire



Apresentações






Pesquisadores

  • Pedro Henrique ....
  • Arthur Filipe Sousa Gomes
  • Henrique Amaral de Omena