Postagens

Mostrando postagens de maio, 2023

Aula 30/5/2023

  Pauta: -  Cientista de Dados Municipal RJ, minha filha, Robson (CENA), Gustavo (Harvard), Antônio (China) etc. - Laboratório de IA – CD e Gestão 4.0 e 5.0        Campus da USP de Piracicaba               - América Latina, próximo passo - Reflexão IA Indutiva Não Supervisionada (dois tipos, exemplos). Ver postagem PCA e Biplot.   - Fazer contrates em MANOVA - Fechando o conteúdo. Algumas ferramentas para urgências, com dados pobres. Completaremos em treinamentos do Lab. IA-CD e Gestão.  Também com outras disciplinas, mais 3 de PG (2 em inglês)     ================================= Seleção de Variáveis Preditoras para IA ================================= - Refazer ANOVA agregar Tukey data selecao; input Categ $ IMC Movim KCal Colesterol Ac_Urico; Cards; ATL 20.9 60.9 3259 114.59 5.59 ATL 21.3 54.8 3100 127.35 3.28 ATL 19.3 49.6 2800 121.09 6.96 ATL 21.1 ...

IA Indutiva Não Supervisionada para Redução de Dimensão – PCA e Biplot

Imagem
IA Indutiva Não Supervisionada para Redução de Dimensão – PCA e Biplot   data pca_1; input Categ $ IMC Movim KCal Colesterol Ac_Urico; cards; ATL 20.51666667 53.46666667 3076.5 119.26 5.086666667 PROF 25.16 2.64 2655 202.346 4.158 SEDE 25.33333333 3.066666667 2625 191.4966667 5.246666667 SEMI 22.88333333 16.83333333 2900 145.7366667 4.641666667 ; proc print; run; /* input Categ $ IMC Movim KCal Colesterol Ac_Urico; */ title "PCA - Biplots"; title "Melhor fazer com Medias ou Medianas ou Trimedias"; proc prinqual plots=(MDPref)                  /* project onto Prin1 and Prin2 */                ; /* use COV scaling */    transform identity(IMC Movim Colesterol);   /* identity transform */    id Categ; ods select MDPrefPlot; run;  

MANOVA

  Program to do MANOVA data imc_dat; input cat $ imc corr kcal; cards; ATL 20.2 60.7 3200 ATL 21.3 54.8 3100 ATL 19.3 49.6 2800 ATL 21.1 52.3 3300 SEMI 22.4 14.9 2600 SEMI 21.9 17.8 2700 SEMI 23.8 18.6 3200 SEMI 24.1 15.1 3300 SEDE  27.3 2.5 2700 SEDE 23.4 4.3 2300 SEDE  25.2 2.3 2600 SEDE  26.4 2.6 3200 PROF 26.2 4.1 2600 PROF 24.2 2.1 2700 PROF 25.4 1.9 2650 ; proc print; run; proc glm;  class cat;  model imc corr kcal  = cat;  contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;  contrast " Professor Vs Sedentario" cat  0 1 -1 0;  contrast " Atleta Vs Semiatleta" cat -1 0 0 1;  manova h=_all_ / printe printh;  contrast " Atl e Semiat Vs Seden e Prof"  cat 1 -1 -1 1;  contrast " Professor Vs Sedentario" cat  0 1 -1 0;  contrast " Atleta Vs Semiatleta" cat -1 0 0 1; run; Elaboração de Contraste: AT PR  SE SEM 1  -1 -1   1 Atleta e Semiatleta Vs Professor e Sedentario 0...

ML Não Superv. para Clasificação

Imagem
  ML Não Superv. para Clasificação Com 5 Variáveis Preditoras Vamos Aumentar para Aproximar de  Situações Reais   Calcular as medias aritmeticas em planilha eletronica (Excel ou LO Calc) Categ IMC Movim KCal Colesterol Ac_Urico ATL 20.? 60.? 22?? 11?.?? 5.?? ATL 21.3 54.8 2107 127.35 3.28 ATL 19.3 49.6 1970 121.09 6.96 ATL 21.1 52.3 2357 111.84 4.06 ATL 20.3 52.2 2742 124.22 5.12 ATL 20.2 51.0 2570 116.47 5.51 SEMI 22.4 14.9 2289 145.61 3.96 SEMI 21.9 17.8 2987 140.91 4.11 SEMI 23.8 18.6 2343 149.90 6.98 SEMI 24.1 15.1 2310 149.33 3.21 SEMI 22.2 16.4 1894 143.26 4.04 SEMI 22.9 18.2 2701 145.41 5.55 SEDE 27.3 2.5 2096 213.90 5.03 SEDE 23.4 4.3 2637 155.78 5.39 SEDE 25.2 2.3 2420 198.01 5.61 SEDE 26.4 2.6 2468 219.55 4.74 SEDE 25.4 3.4 2017 184.84 5.21 SEDE 24.3 3.3 2717 176.90 5.50 PROF 26.2 4.1 2114 177.66 3.11 PROF 24.2 2.1 2471 218.84 5.09 PROF 25.4 1.9 2979 205.04 3.96 PROF 25.2 3.1 2181 198.25 4.10 PROF 24.8 2.0 2755 211.94 4.53   Sequencia para Ler do Blog para ...

Aula 23/5/2023

  Pauta: -  Tai Chi Chuan de Dados e Arquivos         - A pedido de Erik             - Ele é rancoroso, não esquece   - Poca coisa nova, se der Robust ANOVA e MANOVA cc tranquilo

ML Não Superv. para Clasificação - 5 Variáveis Preditoras

Imagem
  ML Não Superv. para Clasificação Com 5 Variáveis Preditoras Vamos Aumentar para Aproximar de  Situações Reais   Calcular as medias aritmeticas em planilha eletronica (Excel ou LO Calc) Categ IMC Movim KCal Colesterol Ac_Urico ATL 20.? 60.? 22?? 11?.?? 5.?? ATL 21.3 54.8 2107 127.35 3.28 ATL 19.3 49.6 1970 121.09 6.96 ATL 21.1 52.3 2357 111.84 4.06 ATL 20.3 52.2 2742 124.22 5.12 ATL 20.2 51.0 2570 116.47 5.51 SEMI 22.4 14.9 2289 145.61 3.96 SEMI 21.9 17.8 2987 140.91 4.11 SEMI 23.8 18.6 2343 149.90 6.98 SEMI 24.1 15.1 2310 149.33 3.21 SEMI 22.2 16.4 1894 143.26 4.04 SEMI 22.9 18.2 2701 145.41 5.55 SEDE 27.3 2.5 2096 213.90 5.03 SEDE 23.4 4.3 2637 155.78 5.39 SEDE 25.2 2.3 2420 198.01 5.61 SEDE 26.4 2.6 2468 219.55 4.74 SEDE 25.4 3.4 2017 184.84 5.21 SEDE 24.3 3.3 2717 176.90 5.50 PROF 26.2 4.1 2114 177.66 3.11 PROF 24.2 2.1 2471 218.84 5.09 PROF 25.4 1.9 2979 205.04 3.96 PROF 25.2 3.1 2181 198.25 4.10 PROF 24.8 2.0 2755 211.94 4.53 ...

ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA

Imagem
    ML Não Supervisionado para Clasifiação - Cluster Analysis - ANOVA and MANOVA UML - Unsupervised Machine Learning: Machine Learning Não Supervisionado Dados:     - Categoria: Variável Classificatória     - IMC: Primeira Variável Preditora - Indice de Massa Corporal     - Movim: Segunda Variável Preditora - Movimentação caminhando ou correndo por semana (Km)      - KCal:  Quilocalorias consumidas por dia Categ IMC Movim KCal ATL 20,? 60,? 32?? ATL 21,3 54,8 3100 ATL 19,3 49,6 2800 ATL 21,1 52,3 3300 SEMI 22,4 14,9 2600 SEMI 21,9 17,8 2700 SEMI 23,8 18,6 3200 SEMI 24,1 15,1 3300 SEDE 27,3 2,5 2700 SEDE 23,4 4,3 2300 SEDE 25,2 2,3 2600 SEDE 26,4 2,6 3200 PROF 26,2 4,1 2600 PROF 24,2 2,1 2700 PROF 25,4 1,9 2650 Obter as Médias por Data Crunching - Pivot Table Categor IMC Movim Kcal ATL 20,65 54,4 3114,75 PROF 25,27 2,7 2650 SEDE 25,58 2,925 2700 SEMI 23,05 16,6 2950 \t para trocar o tab por espaço em Linux   ...