Skip to main content
Arquivos Brasileiros de Cardiologia logoLink to Arquivos Brasileiros de Cardiologia
. 2022 Jan 1;118(1):95–102. [Article in Portuguese] doi: 10.36660/abc.20200596
View full-text in English

Machine Learning na Medicina: Revisão e Aplicabilidade

Gabriela Miana de Mattos Paixão 1,, Bruno Campos Santos 1, Rodrigo Martins de Araujo 1, Manoel Horta Ribeiro 1, Jermana Lopes de Moraes 1,2, Antonio L Ribeiro 1
PMCID: PMC8959062  PMID: 35195215

Introdução

O aprendizado de máquina, ou machine learning (ML), é um ramo da inteligência artificial (IA) que explora o estudo e a construção de algoritmos computacionais a partir do aprendizado por dados,1,2 ao invés de instruções pré–programadas.3 O objetivo principal de um modelo de ML é construir um sistema de computador que aprenda com um banco de dados pré–definido e gere, ao final, um modelo de predição, classificação ou detecção.

A aplicação de ML na prática é voltada principalmente para o manuseio de bases de dados consolidadas com informações heterogêneas, para as quais há uma limitação do uso das técnicas de estatística convencionais.4,5 Os algoritmos de ML já estão difundidos em diversas áreas, como sistemas bancários para detecção de fraudes, mecanismos de busca na internet, sistemas de vigilância em vídeo, segurança de dados, logística de empresas, robótica e, na medicina, para diagnóstico e prognóstico.6 Com a digitalização dos prontuários médicos, exames laboratoriais e de imagem, houve um crescimento dos bancos de dados. Esses são fontes para a aplicação de técnicas de ML, visando a prevenção, diagnóstico precoce e o tratamento das doenças.

Este artigo de revisão aborda uma introdução sobre ML dividida em: definição, modelos de aprendizagem e uma revisão sistemática de artigos sobre a sua aplicabilidade na medicina e, principalmente, na cardiologia. O objetivo é apresentar ML para médicos e profissionais de saúde como uma ferramenta de auxílio para a prática clínica.

Para a estruturação deste artigo de revisão foram pesquisadas duas bases de dados: PubMed (NCBI) e Medline, os seguintes descritores na língua inglesa: “machine learning”, “artificial intelligence”, “unsupervised learning”, “supervised learning”, “neural networks” e “cardiology”. Foram incluídos: estudos prospectivos e retrospectivos, excluídos: casos clínicos e resumos apresentados em congressos (não publicados sob a forma de artigo). A elegibilidade de cada estudo foi avaliada por dois investigadores. As opiniões divergentes relativamente à relevância dos artigos foram abordadas por consenso entre os autores.

Machine learning

O aprendizado de máquina é um subcampo da ciência da computação que busca uma interseção de técnicas matemáticas e estatísticas com algoritmos computacionais.3,7 ML utiliza algoritmos com o conceito de IA e é aplicada em determinadas situações em que se busca padrões em um conjunto de variáveis com o intuito de prever um resultado específico de interesse.8,9

A maioria das técnicas convencionais usadas em sistemas computacionais aplicados à medicina empregam o conceito de algoritmos baseados em regras, chamados de “sistemas especialistas”. Assim, o desenvolvedor codifica os conhecimentos médicos sobre um determinado assunto para esses sistemas, utilizando regras já conhecidas. Já as técnicas de ML manuseiam um grande número de variáveis, buscando uma variedade de novas combinações que possam prever um resultado com confiabilidade, muitas vezes, em uma grande quantidade de dados, tais como big data.7

Em 2001, Doug Laney definiu um modelo de “3 Vs” para conceituar o termo big data: grande volume, alta velocidade e alta variedade de informações exigem novas técnicas de processamento de forma a permitir descobertas e otimizar processos.10 O termo big data pode ser tanto um conjunto de dados de tamanho enorme, que nenhuma das ferramentas tradicionais de gerenciamento de dados é capaz de armazená–los ou processá–los com eficiência, como também pode se referir a um tipo de tecnologia (como instalações de armazenamento, ferramentas e processos).11

O processo de desenvolvimento de um algoritmo de ML é dividido em três fases: pré–processamento, treinamento e avaliação do modelo (Figura 1). A primeira fase consiste em organizar o banco de dados, definir a pergunta de pesquisa e dividir os dados em treinamento e teste. No treinamento, o aprendizado pode ocorrer de forma supervisionada ou não supervisionada.1215 O aprendizado supervisionado é baseado no treinamento de uma amostra de dados com a classificação correta já atribuída, enquanto o não supervisionado se refere à capacidade de aprender e organizar informações sem a atribuição da classificação correta.14 Na fase de avaliação, o modelo é comparado com os dados de teste e os resultados são gerados. Portanto, os algoritmos de ML aprendem através de repetidas observações e estabelecem um padrão de mapeamento com o intuito de rotular os dados e criar um modelo que generaliza as informações, de modo que novos dados (jamais analisados pelo algoritmo) possam ser rotulados com precisão e confiabilidade.15

Figura 1. Fases para o desenvolvimento de algoritmos de machine learning.15.

Figura 1

É importante salientar que o processo de desenvolvimento de um algoritmo de ML deve ser realizado com uma base de dados consolidada e validada, pois modelos de ML desenvolvidos com dados não consolidados podem gerar resultados enganosos.5

Machine learning supervisionada e não supervisionada

A principal diferença entre os modelos de aprendizagem supervisionado e não supervisionado está no algoritmo de treinamento. No aprendizado não supervisionado, o modelo de ML extrai as características dos dados e constrói uma representação sem o conhecimento prévio dos rótulos de cada dado, ou seja, identifica o padrão das informações de classe heuristicamente. Essa falta de supervisão para o algoritmo pode ser vantajosa, pois permite que o algoritmo analise os padrões que não foram considerados anteriormente.1214

No aprendizado supervisionado, o modelo do ML tem o conhecimento do rótulo dos dados, ou seja, as amostras estão corretamente classificadas. O treinamento é baseado na comparação entre o resultado obtido do modelo e o rótulo previamente classificado. Esse processo é repetido até se obter um erro mínimo.14

A Tabela 1 resume as principais características de cada tipo de modelo de aprendizado, bem como suas vantagens e desvantagens e aplicabilidade prática.

Tabela 1. Comparação entre processo de aprendizagem supervisionado e não supervisionado.

Aprendizado supervisionado Aprendizado não supervisionado
Definição Algoritmos que aprendem relações entre atributos de entrada e de saída a partir de conjunto de exemplos rotulados Algoritmos que buscam encontrar padrões em agrupamentos de dados com características semelhantes, em busca de categorias e desfechos ainda não identificados ou não informados
Vantagens Análise de múltiplos parâmetros. Solução rápida e automática para questões de grande escala e elevada acurácia Menor interferência humana na análise dos dados. Excelente excelente para fontes de dados multimodais ou multidimensionais. Permite identificação de novos desfechos
Desvantagens Necessidade dos dados serem rotulados, o que para grandes volumes de dados pode ser impraticável. Tendência ao sobreajuste dos dados Custo elevado e técnicas complexas. Necessita grande quantidade de dados para elaboração do algoritmo. Interpretação dos resultados pode ser desafiadora
Principais tarefas Regressão, classificação, modelo prognóstico e análise de sobrevivência Redução da dimensionalidade do problema e agrupamento
Exemplos de algoritmos Regressão logística, árvores de decisão, random forests e redes neurais artificiais Análise das componentes principais, agrupamento hierárquico, autoencoders, análise linear de discriminantes

Técnicas de machine learning

Diversas técnicas de ML têm sido aplicadas como forma de sistemas de diagnóstico auxiliado por computador, tais como: redes neurais artificiais (RNAs), regressão logística, árvore de decisão, random forests, rede bayesiana, deep learning, support vector machine (SVM), entre outros.1621 Algumas técnicas utilizam modelos matemáticos por meio dos dados para aprendizagem e/ou organização das informações.12 Outras utilizam representações matemáticas com alto grau de abstração (modelos matemáticos complexos). Neste caso, não é possível decifrar ou interpretar os métodos utilizados para obtenção dos resultados de predição, detecção ou classificação, de modo que tais modelos de ML são chamados de “caixa preta”.22

Uma RNA é um modelo computacional e matemático desenvolvido para funcionar como o cérebro humano. Uma RNA possui diversos elementos de interconexões (camada de preditores, camada oculta e camada de resultados). A relação entre essas camadas é inspirada nas conexões sinápticas entre os neurônios (Figura 2).12,15,23

Figura 2. Estrutura do funcionamento de uma rede neural artificial.19.

Figura 2

Uma RNA “aprende” através dessas conexões entre as camadas (preditores, oculta e resultados) e os pesos associados a cada camada. Sendo assim, um dado de entrada é apresentado na camada de preditores, sendo esse enviado camada a camada. O processamento matemático ocorre no envio de dados de uma camada a outra e os pesos dessas conexões são atualizados de acordo com o erro da camada de resultados, ou seja, a relação do resultado esperado e o resultado obtido. Esse processo é repetido até o valor do erro ser mínimo ou um valor especificado de interações.12,23,24

Deep learning difere o seu aprendizado das técnicas mais tradicionais de ML, pois processa modelos computacionais mais robustos e com múltiplas camadas de processamento baseadas em RNAs. Sendo assim, a técnica de deep learning funciona semelhante a uma RNA, mas possuindo um número maior de camadas ocultas e, consequentemente mais conexões sinápticas. Cada camada reproduz uma representação dos dados oriundos da camada anterior e seu algoritmo de aprendizado pode ser tanto supervisionado como não supervisionado.25,26

Com o grande volume e a complexidade dos dados que envolvem trabalhar com big data, o algoritmo do autoencoder é um tipo de RNA que reduz a dimensionalidade dos dados. Para isso, esse algoritmo utiliza modelos matemáticos com alto grau de abstração para gerar um novo conjunto de dados reduzidos em dimensionalidade com representação o mais próxima possível dos dados de entrada. A diferença fundamental entre a RNA e o autoencoder é que o último utiliza em sua fase de treinamento dados não–rotulados.27

O algoritmo da árvore de decisão é o mais utilizado quando o conjunto de dados é relativamente pequeno e é desenvolvido com uma série de perguntas de sim/não para classificar os dados em categorias. Esse algoritmo utiliza um modelo estatístico para classificação ou predição de dados. Cada pergunta se divide em possíveis resultados e esses se ramificam em outras possibilidades; isso se repete até um desfecho final.16 As principais vantagens deste algoritmo são sua simplicidade e interpretação intuitiva.28

Random forests são uma ampliação do algoritmo da árvore de decisão, sendo bastante utilizado para resolução de problemas de classificação e regressão. As árvores de decisão são combinadas e cada uma é treinada independentemente. Suas principais características são: teoria simples, velocidade rápida na análise dos dados, estabilidade com a presença de excesso de ruído e mecanismo de compensação automática em amostras tendenciosas dos dados.29

A rede bayesiana é outra técnica muito aplicada à medicina. Métodos estatísticos bayesianos com uma fundamentação teórica que crenças subjetivas coerentes a especialistas de uma determinada área podem ser expressas em uma estrutura probabilística.17

O SVM é um método de ML com aprendizado supervisionado, amplamente utilizado em bioinformática. Este algoritmo utiliza a ideia de minimização do erro e trabalha com teoria estatística do aprendizado e da otimização. Além da classificação binária, o SVM pode ser usado na regressão de dados contínuos, chamado de regressão do vetor de suporte. Os resultados obtidos com o uso do SVM são comparáveis aos de RNAs, apresentando processo de treinamento fácil e trabalhando com alta dimensionalidade de dados. Portanto, esse encontra um compromisso entre menor complexidade e erro.30,31

Dessa forma, cada algoritmo utiliza técnicas distintas de como aprender com observações e como realizar um mapeamento do conjunto de preditores para o resultado final. Esse deve generalizar as informações, de modo que uma tarefa possa ser executada corretamente com entradas novas, não analisadas anteriormente pelo modelo.14

Machine learning na medicina

Desde o século passado, os pesquisadores exploram as diversas aplicações das técnicas de ML em todos os campos da medicina.32 A pesquisa médica envolvendo ML tem crescido exponencialmente ao longo das últimas décadas. Os dados do PubMed (NCBI) e Medline, envolvendo os descritores “machine learning”, “artificial intelligence”, “unsupervised learning”, “supervised learning” e “neural networks”, revelou 113.127 artigos publicados entre 1951 e 2019 (Figura 3). Ao acrescentar–se o descritor “cardiology” como condição obrigatória na pesquisa dos demais termos, 888 trabalhos retornam com distribuição semelhante à anterior, entre os anos de 1986 e 2019.

Figura 3. Número de artigos por ano e acumulado durante o período de 1951 a 2019 no PubMed e Medline.

Figura 3

A capacidade dos algoritmos de ML de reconhecer padrões e predizer diagnóstico tem sido amplamente aplicada às diversas áreas de atenção à saúde.3336 Na dermatologia, uma RNA foi capaz de diferenciar lesões dermatológicas em benignas versus malignas, a partir de mais de 129.000 casos, com resultados similares a um comitê de 21 dermatologistas.35 No campo da psiquiatria, o estudo com técnicas de ML reduziu o número de critérios diagnósticos de 29 para 8 com 100% de acurácia em 612 pacientes com diagnóstico firmado de transtorno do espectro autista.36

A adição de tecnologias móveis, tais como: smartphone e smartwatches, aplicadas à área da saúde acrescentou mais uma dimensão ao ML, permitindo a leitura de grandes quantidades de dados pessoais em algoritmos de aprendizado.37 Dentro de sistemas de feedback, a tecnologia móvel consegue ser um dispositivo biométrico (por exemplo, medir os níveis de glicose no sangue) com capacidade de direcionamento para intervenções clínicas em tempo real, baseadas em algoritmos que atualizam continuamente as informações pessoais do paciente.38 A tecnologia pode simplificar os processos diagnósticos e facilitar a prática clínica.

Machine learning na cardiologia

O avanço na capacidade computacional nas últimas décadas impactou especialmente o campo da detecção e predição de doenças cardiovasculares por meio da interpretação de dados, como: estudos dos prontuários médicos, exames de imagem, banco de dados biológicos e genômicos e de avaliação molecular.32 A cardiologia é uma das áreas de maior impacto na produção científica usando técnicas de ML (Tabela 2). Desde a predição de eventos cardiovasculares39 à melhoria dos diagnósticos eletrocardiográficos,40,41 a IA tem sido ferramenta importante para a pesquisa cientifica.

Tabela 2. Artigos com o uso das técnicas machine learning na cardiologia.

Artigo Principais resultados
Can machine-learning improve cardiovascular risk prediction using routine clinical data?38 O algoritmo foi capaz de predizer 4998 de 7404 casos positivos (sensibilidade 67,5%, VPP 18,4%) e 53458 de 75585 casos negativos (especificidade 70,7% e VPN 95,7%), com ganho de 355 pacientes (+7,6%) que desenvolveram doenças cardiovasculares em relação ao método tradicional.
Deep neural networks can predict mortality from 12-lead electrocardiogram voltage data43 Por meio da análise isolada do ECG por algoritmo de ML, foi possível predizer mortalidade por todas as causas em um ano com AUC = 0,84 e p < 0,05.
Phenomapping for the Identification of Hypertensive Patients with the Myocardial Substrate for Heart Failure with Preserved Ejection Fraction56 Um grupo de 1273 pacientes hipertensos foi avaliado por meio de técnicas de ML, utilizando dados clínicos, laboratoriais e ecocardiográficos. Foi possível identificar um grupo de pacientes com maior risco de desenvolver insuficiência cardíaca de fração preservada que, provavelmente, devem ser beneficiar de tratamento clínico mais intensivo.
Cognitive Machine-Learning Algorithm for Cardiac Imaging: A Pilot Study for Differentiating Constrictive Pericarditis From Restrictive Cardiomyopathy57 Utilizaram técnicas de ML para diferenciar pericardite constritiva de cardiomiopatia restritiva com uma curva ROC de 96,2% e acurácia superior a 90%.
Structured learning algorithm for detection of nonobstructive and obstructive coronary plaque lesions from computed tomography angiography58 O algoritmo de ML foi capaz de detectar lesões coronarianas superiores ou iguais a 25% com uma sensibilidade 93%, especificidade 95% e acurácia de 94% em 42 angiografias coronárias.
A deep neural network learning algorithm outperforms a conventional algorithm for emergency department electrocardiogram interpretation54 A análise automática pelo método de ML para a leitura de ECG em um departamento de emergência obteve sensibilidade (88,7% versus 92,0%, p < 0,086), especificidade (94% versus 84,7%, p < 0,0001), VPP (88,2% versus 75,4%, p < 0,0001) e acurácia (92,2% versus 87,2%, p < 0,0001) em relação ao método automático convencional.
Automatic Diagnosis of the Short-Duration 12-Lead ECG using a Deep Neural Network: the CODE Study53 Uma rede neural treinada foi capaz de detectar 6 classes de anormalidades eletrocardiográficas com especificidade superior a 99% e performance superior a 80%, comparada com residentes de cardiologia do último ano.
An artificial intelligence-enabled ECG algorithm for the identification of patients with atrial fibrillation during sinus rhythm: a retrospective analysis of outcome prediction55 Um software de ML foi capaz de detectar pacientes portadores de fibrilação atrial, a partir de ECG em ritmo sinusal com uma sensibilidade de 79%, especificidade 79,5% e acurácia de 79,4%.

ECG: eletrocardiograma; ML: machine learning; VPN: valor preditivo negativo; VPP: valor preditivo positivo.

Prognóstico

Diversos escores de risco cardiovasculares foram desenvolvidos no intuito de predizer eventos cardiovasculares e identificar os indivíduos com maior risco cardíaco para a prevenção primária.42 No entanto, a despeito de todo o avanço propedêutico e terapêutico na cardiologia, ainda há uma população em risco não identificada pelos métodos tradicionais.43 O reconhecimento de potenciais fatores de risco não tradicionais é desejável e o uso de novas tecnologias, como a IA, torna–se método promissor nessa busca.

A predição de mortalidade por todas as causas no período de um ano, a partir da análise isolada do eletrocardiograma (ECG), apresentou resultados promissores (AUROC 0,87; p < 0,05).44 É interessante ressaltar que uma análise cega destes ECG feita por três cardiologistas sugere que os padrões encontrados para predizer mortalidade pelo ML não são aparentemente visíveis pela avaliação médica convencional.44

Em estudo com 2619 pacientes submetidos à tomografia computadorizada com emissão de prótons para a predição de risco cardiovascular, as técnicas de ML apresentaram melhores resultados (AUROC 0,81; p < 0.01) do que a análise isolada do exame.45

Estudo com mais de 380.000 pacientes do Reino Unido avaliou o uso de técnicas de ML na predição do risco de eventos cardiovasculares em comparação com os algoritmos tradicionais propostos pelo American College of Cardiology e pela American Heart Association39. Houve melhoria de até 7,6% na predição de eventos com uso de RNA. Algumas variáveis clínicas que não são valorizadas para doença cardiovascular pelos métodos tradicionais como depressão e uso de corticoides foram importantes para o risco cardiovascular avaliado pelas técnicas de ML.39 Este achado foi corroborado por estudo multicêntrico estadunidense em que os parâmetros encontrados para predição de risco cardiovascular diferem daqueles incluídos nas calculadoras de risco tradicionais.46

A IA pode contribuir na geração de modelos preditivos mais complexos e específicos para cada indivíduo,47 com a incorporação dos componentes genômicos aos escores de risco cardiovascular.48,49 A associação dos dados clínicos, sociais, demográficos e genéticos com os exames disponíveis pode permitir uma avaliação mais individualizada, visando à promoção de saúde.47

Diagnóstico

Nos exames cardiológicos, a necessidade de uma equipe médica altamente especializada, a variabilidade de laudos entre os médicos, além do tempo dispensado aos laudos motivaram o estudo das técnicas de ML como ferramenta diagnóstica.41,50

Os estudos foram promissores e as modalidades da imagem cardíaca como ecocardiografia, tomografia computadorizada e ressonância nuclear magnética apresentaram boa acurácia em correlacionar alterações estruturais com a etiologia e fisiopatologia de doenças cardiovasculares.51,52 Em um estudo com 159 pacientes, o qual utilizou três técnicas de ML para auxiliar na diferenciação ecocardiográfica entre cardiomiopatia hipertrófica e hipertrofia fisiológica de atletas. Os parâmetros encontrados, como: a razão da velocidade transmitral diastólica precoce–tardia (p < 0.01), velocidade diastólica precoce (e’) (p < 0.01) e a análise de strain (p < 0.01), foram melhores em sensibilidade e especificidade do que os tradicionalmente usados.51

Um algoritmo de ML foi desenvolvido para diferenciar as estenoses coronarianas intermediárias pela angiografia com reserva de fluxo fracionada menor que 0,80 versus maior que 0,80, a partir de dados clínicos e angiográficos. Os resultados foram satisfatórios com acurácia de aproximadamente 80% para predição de reserva de fluxo fracionada menor que 0,8 (AUROC 0,84 a 0,87, IC 95% 0,71 a 0,89). A validação externa do modelo desenvolvido também apresentou resultados similares em 79 pacientes de dois outros centros (AUROC 0,89, IC 95% 0,83 a 0,95).53

Em relação à eletrocardiografia, estudos estão sendo desenvolvidos para melhoria dos diagnósticos automáticos.41 Através de técnicas de ML, nosso grupo foi capaz de identificar seis classes eletrocardiográficas por meio da análise do ECG de 12 derivações com boa acurácia, comparável ao desempenho que residentes de cardiologia do último ano.54 Em pacientes com emergências cardiovasculares hospitalizados, ML teve uma acurácia diagnóstica de cerca de 90% para alterações maiores ao ECG.54 Além disso, estudo recente foi capaz de identificar pacientes portadores de fibrilação atrial em ECGs em ritmo sinusal com uma sensibilidade de 79%, especificidade 79,5% e acurácia de 79,4%.55

Limites e Desafios

A utilização das técnicas de ML é crescente, devido ao seu potencial para solucionar problemas nas diversas áreas. Na medicina, os resultados são promissores em diversas especialidades com a expectativa de que a IA possa ser ferramenta de auxílio para a prática clínica.3,59 No entanto, ainda é necessária cautela na interpretação e incorporação dos resultados.

Os algoritmos de ML desenvolvidos devem ser reprodutíveis na população geral. Estudos com número pequeno de pacientes, em populações específicas ou com vieses de seleção não permitem a generalização dos seus achados.60,61 Ainda que a captação de dados e sua interpretação tenham valor estatístico considerável, os melhores cenários ainda são incapazes de predizer o desfecho em pessoas diferentes.62

O erro no processo automatizado pode induzir o profissional a conclusões incorretas, como demonstrado em estudo com 30 residentes em clínica médica que reduziram sua acurácia diagnóstica no laudo de ECG, após a disponibilização de laudos automáticos incorretos.63

O avanço da IA na medicina é visto com receio por alguns médicos. A posição alarmista de que ML possa substituir a figura do médico na atenção à saúde tem se mostrado injustificável. Nenhum software, até o momento, foi capaz de substituir o aspecto subjetivo da experiência clínica na tomada de decisões favoráveis ao paciente, exatamente, pela medicina não ser uma ciência exata.64 A negação ao avanço tecnológico e às ferramentas de IA, hoje disponíveis, tem potencial tão danoso quanto a sua total dependência no atendimento ao paciente. A combinação entre ML e o julgamento clínico tem apresentado melhores resultados em conjunto do que o seu uso isolado.59

Conclusão

O uso de técnicas de ML na medicina deixou o campo teórico e se tornou uma realidade. Embora o uso do ML em medicina ainda esteja em desenvolvimento, estudos mostram a sua aplicabilidade clínica com impacto na avaliação diagnóstica e prognóstica.

Funding Statement

O autor Ribeiro AL é parcialmente apoiado pelo CNPq (310679/2016–8 e 465518/2014–1) e pela FAPEMIG (PPM–00428–17 e RED–00081–16). A autora Moraes JL é apoiada pelo CNPq (141286/2021–0).

Footnotes

Fontes de financiamento

O autor Ribeiro AL é parcialmente apoiado pelo CNPq (310679/2016–8 e 465518/2014–1) e pela FAPEMIG (PPM–00428–17 e RED–00081–16). A autora Moraes JL é apoiada pelo CNPq (141286/2021–0).

Vinculação acadêmica

Este artigo é parte de dissertação de mestrado de Gabriela Miana de Mattos Paixão pela Universidade Federal de Minas Gerais.

Referências

  • 1.Mitchell TM, The Discipline of Machine Learning. Pittsburgh: Mach Learning Department; 2006.
  • 2.Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. Berlin: Springer Science & Business Media; 2009.
  • 3.Deo RC. Machine Learning in Medicine. Circulation. 2015;132(20):1920-30. doi: 10.1161/CIRCULATIONAHA.115.001593. [DOI] [PMC free article] [PubMed]
  • 4.Jordan MI, Mitchell TM. Machine Learning: Trends, Perspectives, and Prospects. Science. 2015;349(6245):255-60. doi: 10.1126/science.aaa8415. [DOI] [PubMed]
  • 5.Chen M, Mao S, Liu Y. Big data: A survey. Mob. Netw. Appl. 2014;19(2):171-209. doi:10.1007/s11036-013-0489-0.
  • 6.Zhou L, Pan S, Wang J, Vasilakos AV. Machine Learning on Big Data: Opportunities and Challenges. Neurocomputing. 2017;237:350-61. doi: 10.1016/j.neucom.2017.01.026.
  • 7.Obermeyer Z, Emanuel EJ. Predicting the Future - Big Data, Machine Learning, and Clinical Medicine. N Engl J Med. 2016;375(13):1216-9. doi: 10.1056/NEJMp1606181. [DOI] [PMC free article] [PubMed]
  • 8.Waljee AK, Higgins PD. Machine Learning in Medicine: A Primer for Physicians. Am J Gastroenterol. 2010;105(6):1224-6. doi: 10.1038/ajg.2010.173. [DOI] [PubMed]
  • 9.Darcy AM, Louie AK, Roberts LW. Machine Learning and the Profession of Medicine. JAMA. 2016;315(6):551-2. doi: 10.1001/jama.2015.18421. [DOI] [PubMed]
  • 10.Laney D. 3D Data Management: Controlling Data Volume, Velocity, and Variety. Milan: META Group Research Note; 2001.
  • 11.Martin-Sanchez F, Verspoor K. Big Data in Medicine is Driving Big Changes. Yearb Med Inform. 2014;9(1):14-20. doi: 10.15265/IY-2014-0020. [DOI] [PMC free article] [PubMed]
  • 12.Barreto GA, Souza LG. Adaptive Filtering with the Self-Organizing Map: A Performance Comparison. Neural Netw. 2006;19(6-7):785-98. doi: 10.1016/j.neunet.2006.05.005. [DOI] [PubMed]
  • 13.Kohonen T, Honkela T. Kohonen Network. Scholarpedia. 2007;2(1):1568. doi: 10.4249/scholarpedia.1568.
  • 14.Sathya R, Abraham A. Comparison of Supervised and Unsupervised Learning Algorithms for Pattern Classification. Int. J. Artif. Intell. 2013;2(2):34-8. doi: 10.14569/IJARAI.2013.020206.
  • 15.Rajkomar A, Dean J, Kohane I. Machine Learning in Medicine. N Engl J Med. 2019;380(14):1347-58. doi: 10.1056/NEJMra1814259. [DOI] [PubMed]
  • 16.Podgorelec V, Kokol P, Stiglic B, Rozman I. Decision Trees: An Overview and Their Use in Medicine. J Med Syst. 2002;26(5):445-63. doi: 10.1023/a:1016409317640. [DOI] [PubMed]
  • 17.Pang B, Zhang D, Li N, Wang K. Computerized Tongue Diagnosis Based on Bayesian Networks. IEEE Trans Biomed Eng. 2004;51(10):1803-10. doi: 10.1109/TBME.2004.831534. [DOI] [PubMed]
  • 18.Lisboa PJ, Taktak AF. The Use of Artificial Neural Networks in Decision Support in Cancer: A Systematic Review. Neural Netw. 2006;19(4):408-15. doi: 10.1016/j.neunet.2005.10.007. [DOI] [PubMed]
  • 19.Ramesh AN, Kambhampati C, Monson JR, Drew PJ. Artificial Intelligence in Medicine. Ann R Coll Surg Engl. 2004;86(5):334-8. doi: 10.1308/147870804290. [DOI] [PMC free article] [PubMed]
  • 20.Mavroforakis ME, Theodoridis S. A Geometric Approach to Support Vector Machine (SVM) Classification. IEEE Trans Neural Netw. 2006;17(3):671-82. doi: 10.1109/TNN.2006.873281. [DOI] [PubMed]
  • 21.Smith SW, Walsh B, Grauer K, Wang K, Rapin J, Li J, et al. A Deep Neural Network Learning Algorithm Outperforms a Conventional Algorithm for Emergency Department Electrocardiogram Interpretation. J Electrocardiol. 2019;52:88-95. doi: 10.1016/j.jelectrocard.2018.11.013. [DOI] [PubMed]
  • 22.Bianchi RE. Extração de Conhecimento Simbólico em Técnicas de Aprendizado de Máquina Caixa-Preta por Similaridade de Rankings [dissertation]. São Paulo: Universidade de São Paulo; 2008.
  • 23.Al-Shayea QK. Artificial Neural Networks in Medical Diagnosis. Int. J. Comput. Sci. Issues. 2011;8(2):150-4.
  • 24.Bengio Y, Courville A, Vincent P. Representation Learning: A Review and New Perspectives. IEEE Trans Pattern Anal Mach Intell. 2013;35(8):1798-828. doi: 10.1109/TPAMI.2013.50. [DOI] [PubMed]
  • 25.Miotto R, Wang F, Wang S, Jiang X, Dudley JT. Deep Learning for Healthcare: Review, Opportunities and Challenges. Brief Bioinform. 2018;19(6):1236-46. doi: 10.1093/bib/bbx044. [DOI] [PMC free article] [PubMed]
  • 26.Bengio Y. Learning Deep Architectures for AI. Pittsburgh: Mach Learn; 2009.
  • 27.Raghavendra U, Gudigar A, Bhandary SV, Rao TN, Ciaccio EJ, Acharya UR. A Two Layer Sparse Autoencoder for Glaucoma Identification with Fundus Images. J Med Syst. 2019;43(9):299. doi: 10.1007/s10916-019-1427-x. [DOI] [PubMed]
  • 28.Goodman KE, Lessler J, Cosgrove SE, Harris AD, Lautenbach E, Han JH, et al. A Clinical Decision Tree to Predict Whether a Bacteremic Patient Is Infected with an Extended-Spectrum β-Lactamase-Producing Organism. Clin Infect Dis. 2016;63(7):896-903. doi: 10.1093/cid/ciw425. [DOI] [PMC free article] [PubMed]
  • 29.Segal MR. Machine Learning Benchmarks and Random Forest Regression. São Francisco: Biostatistics; 2004.
  • 30.Chen KC, Chen CYC. Stroke Prevention by Traditional Chinese Medicine? A Genetic Algorithm, Support Vector Machine and Molecular Dynamics Approach. Soft Matter. 2011. 7(8):4001-8. doi: 10.1039/c0sm01548b.
  • 31.Krittanawong C, Zhang H, Wang Z, Aydar M, Kitai T. Artificial Intelligence in Precision Cardiovascular Medicine. J Am Coll Cardiol. 2017;69(21):2657-64. doi: 10.1016/j.jacc.2017.03.571. [DOI] [PubMed]
  • 32.Fan Y, Shen D, Davatzikos C. Detecting Cognitive States from fMRI Images by Machine Learning and Multivariate Classification. CVPRW’06 2006: Conference on Computer Vision and Pattern Recognition Workshop; 2006 Jun 17-22; Ney York, USA: IEEE; 2006. p. 89.
  • 33.Gulshan V, Peng L, Coram M, Stumpe MC, Wu D, Narayanaswamy A, et al. Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs. JAMA. 2016;316(22):2402-10. doi: 10.1001/jama.2016.17216. [DOI] [PubMed]
  • 34.Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, et al. Dermatologist-Level Classification of Skin Cancer with Deep Neural Networks. Nature. 2017;542(7639):115-8. doi: 10.1038/nature21056. [DOI] [PMC free article] [PubMed]
  • 35.Wall DP, Kosmicki J, Deluca TF, Harstad E, Fusaro VA. Use of Machine Learning to Shorten Observation-Based Screening and Diagnosis of Autism. Transl Psychiatry. 2012;2(4):e100. doi: 10.1038/tp.2012.10. [DOI] [PMC free article] [PubMed]
  • 36.Chen JH, Asch SM. Machine Learning and Prediction in Medicine - Beyond the Peak of Inflated Expectations. N Engl J Med. 2017;376(26):2507-9. doi: 10.1056/NEJMp1702071. [DOI] [PMC free article] [PubMed]
  • 37.Bergenstal RM, Klonoff DC, Garg SK, Bode BW, Meredith M, Slover RH, et al. Threshold-Based Insulin-Pump Interruption for Reduction of Hypoglycemia. N Engl J Med. 2013;369(3):224-32. doi: 10.1056/NEJMoa1303576. [DOI] [PubMed]
  • 38.Weng SF, Reps J, Kai J, Garibaldi JM, Qureshi N. Can Machine-Learning Improve Cardiovascular Risk Prediction Using Routine Clinical Data? PLoS One. 2017;12(4):e0174944. doi: 10.1371/journal.pone.0174944. [DOI] [PMC free article] [PubMed]
  • 39.Slomka PJ, Dey D, Sitek A, Motwani M, Berman DS, Germano G. Cardiac Imaging: Working Towards Fully-Automated Machine Analysis & Interpretation. Expert Rev Med Devices. 2017;14(3):197-212. doi: 10.1080/17434440.2017.1300057. [DOI] [PMC free article] [PubMed]
  • 40.Mincholé A, Camps J, Lyon A, Rodríguez B. Machine Learning in the Electrocardiogram. J Electrocardiol. 2019;57S:61-4. doi: 10.1016/j.jelectrocard.2019.08.008. [DOI] [PubMed]
  • 41.D’Agostino RB Sr, Pencina MJ, Massaro JM, Coady S. Cardiovascular Disease Risk Assessment: Insights from Framingham. Glob Heart. 2013;8(1):11-23. doi: 10.1016/j.gheart.2013.01.001. [DOI] [PMC free article] [PubMed]
  • 42.Lin JS, Evans CV, Johnson E, Redmond N, Coppola EL, Smith N. Nontraditional Risk Factors in Cardiovascular Disease Risk Assessment: Updated Evidence Report and Systematic Review for the US Preventive Services Task Force. JAMA. 2018;320(3):281-97. doi: 10.1001/jama.2018.4242. [DOI] [PubMed]
  • 43.Raghunath SM, Cerna AU, Jing L, vanMaanen D, Stough JV, Hartzel D, et al. Deep Neural Networks Can Predict 1-Year Mortality Directly from ECG Signal, Even when Clinically Interpreted as Normal. Circulation. 2019;140(Suppl 1):A14425-.
  • 44.Betancur J, Otaki Y, Motwani M, Fish MB, Lemley M, Dey D, et al. Prognostic Value of Combined Clinical and Myocardial Perfusion Imaging Data Using Machine Learning. JACC Cardiovasc Imaging. 2018;11(7):1000-9. doi: 10.1016/j.jcmg.2017.07.024. [DOI] [PMC free article] [PubMed]
  • 45.Ambale-Venkatesh B, Yang X, Wu CO, Liu K, Hundley WG, McClelland R, et al. Cardiovascular Event Prediction by Machine Learning: The Multi-Ethnic Study of Atherosclerosis. Circ Res. 2017;121(9):1092-101. doi: 10.1161/CIRCRESAHA.117.311312. [DOI] [PMC free article] [PubMed]
  • 46.Antman EM, Loscalzo J. Precision Medicine in Cardiology. Nat Rev Cardiol. 2016;13(10):591-602. doi: 10.1038/nrcardio.2016.101. [DOI] [PubMed]
  • 47.Johnson KW, Shameer K, Glicksberg BS, Readhead B, Sengupta PP, Björkegren JLM, et al. Enabling Precision Cardiology Through Multiscale Biology and Systems Medicine. JACC Basic Transl Sci. 2017;2(3):311-27. doi: 10.1016/j.jacbts.2016.11.010. [DOI] [PMC free article] [PubMed]
  • 48.Kullo IJ, Jouni H, Austin EE, Brown SA, Kruisselbrink TM, Isseh IN, et al. Incorporating a Genetic Risk Score into Coronary Heart Disease Risk Estimates: Effect on Low-Density Lipoprotein Cholesterol Levels (the MI-GENES Clinical Trial). Circulation. 2016;133(12):1181-8. doi: 10.1161/CIRCULATIONAHA.115.020109. [DOI] [PMC free article] [PubMed]
  • 49.Johnson KW, Soto JT, Glicksberg BS, Shameer K, Miotto R, Ali M, et al. Artificial Intelligence in Cardiology. J Am Coll Cardiol. 2018;71(23):2668-79. [DOI] [PubMed]
  • 50.Narula S, Shameer K, Omar AMS, Dudley JT, Sengupta PP. Machine-Learning Algorithms to Automate Morphological and Functional Assessments in 2D Echocardiography. J Am Coll Cardiol. 2016;68(21):2287-95. doi: 10.1016/j.jacc.2016.08.062. [DOI] [PubMed]
  • 51.Samad MD, Ulloa A, Wehner GJ, Jing L, Hartzel D, Good CW, et al. Predicting Survival From Large Echocardiography and Electronic Health Record Datasets: Optimization With Machine Learning. JACC Cardiovasc Imaging. 2019;12(4):681-9. doi: 10.1016/j.jcmg.2018.04.026. [DOI] [PMC free article] [PubMed]
  • 52.Hae H, Kang SJ, Kim WJ, Choi SY, Lee JG, Bae Y, et al. Machine Learning Assessment of Myocardial Ischemia Using Angiography: Development and Retrospective Validation. PLoS Med. 2018;15(11):e1002693. doi: 10.1371/journal.pmed.1002693. [DOI] [PMC free article] [PubMed]
  • 53.Ribeiro AH, Ribeiro MH, Paixão GMM, Oliveira DM, Gomes PR, Canazart JA, et al. Automatic Diagnosis of the 12-lead ECG Using a Deep Neural Network. Nat Commun. 2020;11(1):1760. doi: 10.1038/s41467-020-15432-4. [DOI] [PMC free article] [PubMed]
  • 54.Smith SW, Walsh B, Grauer K, Wang K, Rapin J, Li J, et al. A Deep Neural Network Learning Algorithm Outperforms a Conventional Algorithm for Emergency Department Electrocardiogram Interpretation. J Electrocardiol. 2019;52:88-95. doi: 10.1016/j.jelectrocard.2018.11.013. [DOI] [PubMed]
  • 55.Attia ZI, Noseworthy PA, Lopez-Jimenez F, Asirvatham SJ, Deshmukh AJ, Gersh BJ, et al. An artificial Intelligence-Enabled ECG Algorithm for the Identification of Patients with Atrial Fibrillation During Sinus Rhythm: A Retrospective Analysis of Outcome Prediction. Lancet. 2019;394(10201):861-7. doi: 10.1016/S0140-6736(19)31721-0. [DOI] [PubMed]
  • 56.Katz DH, Deo RC, Aguilar FG, Selvaraj S, Martinez EE, Beussink-Nelson L, et al. Phenomapping for the Identification of Hypertensive Patients with the Myocardial Substrate for Heart Failure with Preserved Ejection Fraction. J Cardiovasc Transl Res. 2017;10(3):275-84. doi: 10.1007/s12265-017-9739-z. [DOI] [PubMed]
  • 57.Sengupta PP, Huang YM, Bansal M, Ashrafi A, Fisher M, Shameer K, et al. Cognitive Machine-Learning Algorithm for Cardiac Imaging: A Pilot Study for Differentiating Constrictive Pericarditis from Restrictive Cardiomyopathy. Circ Cardiovasc Imaging. 2016;9(6):e004330. doi: 10.1161/CIRCIMAGING.115.004330. [DOI] [PMC free article] [PubMed]
  • 58.Kang D, Dey D, Slomka PJ, Arsanjani R, Nakazato R, Ko H, et al. Structured Learning Algorithm for Detection of Nonobstructive and Obstructive Coronary Plaque Lesions from Computed Tomography Angiography. J Med Imaging (Bellingham). 2015;2(1):014003. doi: 10.1117/1.JMI.2.1.014003. [DOI] [PMC free article] [PubMed]
  • 59.Ribeiro AL, Oliveira GMM. Toward a Patient-Centered, Data-Driven Cardiology. Arq Bras Cardiol. 2019;112(4):371-3. doi: 10.5935/abc.20190069. [DOI] [PMC free article] [PubMed]
  • 60.Anderson A, Labus JS, Vianna EP, Mayer EA, Cohen MS. Common Component Classification: What Can We Learn from Machine Learning? Neuroimage. 2011;56(2):517-24. doi: 10.1016/j.neuroimage.2010.05.065. [DOI] [PMC free article] [PubMed]
  • 61.Halevy A, Norvig P, Pereira F. The Unreasonable Effectiveness of Data. IEEE Intelligent Systems. 2009;24(2):8-12. doi:10.1109/MIS.2009.36.
  • 62.Shaw LJ. Can a Machine Learn Better Than Humans? JACC Cardiovasc Imaging. 2018;11(7):1010-1. doi: 10.1016/j.jcmg.2017.07.025. [DOI] [PubMed]
  • 63.Tsai TL, Fridsma DB, Gatti G. Computer Decision Support as a Source of Interpretation Error: The Case of Electrocardiograms. J Am Med Inform Assoc. 2003;10(5):478-83. doi: 10.1197/jamia.M1279. [DOI] [PMC free article] [PubMed]
  • 64.Svensson CM, Hübler R, Figge MT. Automated Classification of Circulating Tumor Cells and the Impact of Interobsever Variability on Classifier Training and Performance. J Immunol Res. 2015;2015:573165. doi: 10.1155/2015/573165. [DOI] [PMC free article] [PubMed]
Arq Bras Cardiol. 2022 Jan 1;118(1):95–102. [Article in English]

Machine Learning in Medicine: Review and Applicability

Gabriela Miana de Mattos Paixão 1,, Bruno Campos Santos 1, Rodrigo Martins de Araujo 1, Manoel Horta Ribeiro 1, Jermana Lopes de Moraes 1,2, Antonio L Ribeiro 1

Introduction

Machine learning (ML) is a branch of artificial intelligence (AI) that explores the study and construction of computational algorithms based on data learning,1,2 rather than preprogrammed instructions.3 The main objective of an ML model is to construct a computer system that learns from a predefined database and, in the end, generates a model for prediction, classification, or detection.

The application of ML in practice is mainly aimed at handling consolidated databases with heterogeneous information where there is a limitation to the use of conventional statistical techniques.4,5 ML algorithms are already widespread in different areas, such as banking systems for fraud detection, internet search engines, video surveillance systems, data security, business logistics, robotics, and, in medicine, diagnosis and prognosis.6 With the digitalization of medical records, laboratory tests, and imaging, there has been a growth in database are sources for the application of ML techniques, with the aims of prevention, early diagnosis, and treatment of diseases.

This review article provides an introduction to ML structured as follows: definition, learning models, a systematic review of articles on its applicability in medicine, especially cardiology. The objective is to introduce doctors and healthcare professionals to ML as a tool to assist clinical practice.

To structure this review article, the following descriptors in English were searched in the databases PubMed (NCBI) and Medline: “machine learning,” “artificial intelligence,” “unsupervised learning,” “supervised learning,”, “neural networks” and “cardiology.” Prospective and retrospective studies were included, and clinical cases and abstracts presented at conferences (not published as articles) were excluded. Each study's eligibility was assessed by two investigators. Divergent opinions regarding the relevance of articles were addressed by consensus among the authors.

Machine learning

ML is a subfield of computer science that seeks an intersection between mathematical and statistical techniques and computational algorithms.3,7 It uses algorithms with the concept of AI, and it is applied to certain situations to look for patterns within a set of variables in order to predict a specific result of interest.8,9

Most of the conventional techniques used in computer systems applied to medicine employ the concept of rule-based algorithms, known as “expert systems.” Thus, developers encode medical knowledge regarding a particular subject for these systems, using rules that are already known. ML techniques, on the other hand, handle a large number of variables, seeking a variety of new combinations that can reliably predict a result, in many cases, in a high volume of data, such as big data.7

In 2001, Doug Laney defined the “3 Vs” model to conceptualize the term big data: high volume, high velocity, and high variety of information, which require new processing techniques in order to allow discoveries and optimize processes.10 The term big data may refer to either an enormous dataset that no traditional data management tools are able to store or process efficiently or to a type of technology (such as storage facilities, tools, and processes).11

The process of developing an ML algorithm is divided into 3 phases: preprocessing, training, and model evaluation (Figure 1). The first phase consists of organizing the databank, defining the research question, and dividing the data into training and testing. During training, learning can take place in a supervised or unsupervised manner.1215 Supervised learning is based on training a data sample where the correct classification has already been assigned, whereas unsupervised learning refers to the capability to learn and organize information when the correct classification has not been assigned.14 During the evaluation phase, the model is compared with test data, and the results are generated. Therefore, ML algorithms learn by means of repeated observations, and they establish a mapping pattern in order to label the data and create a model that generalizes the information so that new data (that have never been analyzed by the algorithm) can be accurately and reliably labeled.15

Figure 1. Phases for developing machine learning algorithms.15.

Figure 1

It is important to emphasize that the process of developing a ML algorithm must be carried out with a consolidated and validated database, because ML models that are developed with unconsolidated data can generate misleading results.5

Supervised and unsupervised machine learning

The main difference between supervised and unsupervised learning models is in the training algorithm. In unsupervised learning, the ML model extracts the data characteristics and builds a representation without prior knowledge of the labels of each piece of data, that is, it identifies the information classification patterns heuristically. This lack of supervision for the algorithm may be advantageous, because it allows the algorithm to analyze patterns that have not been previously considered.1214

In supervised learning, the ML model possesses knowledge regarding the data labels, that is, the samples are correctly classified. Training is based on the comparison between the result obtained from the model and the previously classified label. This process is repeated until minimum error is reached.14

Table 1 summarizes the main characteristics of each type of learning model, as well as their advantages, disadvantages, and practical applicability.

Table 1. Comparison between supervised and unsupervised learning processes.

Supervised learning Unsupervised learning
Definition Algorithms that learn relationships between input and output attributes based on a set of labeled examples. Algorithms that attempt to find patterns in data clusters with similar characteristics, looking for unidentified or uninformed categories and outcomes.
Advantages Analysis of multiple parameters; quick, automatic solution for large-scale questions and high accuracy. Less human interference in data analysis; excellent for multimodal or multidimensional data sources; allows identification of new outcomes.
Disadvantages Requires data to be labeled; may be impractical for large volumes of data. Tendency to overfit data. High cost; complex techniques. It requires a large amount of data to elaborate the algorithm, and it can be challenging to interpret the results.
Main tasks Regression, classification, prognostic model, and survival analysis. Reducing dimensionality of the problem and grouping.
Examples of algorithms Logistic regression, decision trees, random forests, and artificial neural networks. Principal component analysis, hierarchical clustering, autoencoders, and linear discriminant analysis.

Machine learning techniques

Several ML techniques have been applied as a form of computer-assisted diagnostic systems, such as artificial neural networks (ANNs), logistic regression, decision tree, random forests, Bayesian network, deep learning, support vector machine (SVM), and others.1621 Some techniques use mathematical models by means of data for learning and/or organization of information.12 Others apply mathematical representations with a high degree of abstraction (complex mathematical models). In this case, it is not possible to decipher or interpret the methods used to obtain the prediction, detection, or classification results; these ML models are, thus, known as “black box”.22

An ANN is a computational and mathematical model developed to function like the human brain. An ANN possesses several interconnecting elements (predictor layer, hidden layer, and output layer), and the relationship between these layers is inspired by the synaptic connections between neurons (Figure 2).12,15,23

Figure 2. Functional structure of an artificial neural network.19.

Figure 2

An ANN “learns” by means of these connections between layers (predictors, hidden layer, and results), as well as the weights associated with each layer. Thus, a piece of input data is introduced in the predictor layer and is sent layer by layer. Mathematical processing takes place by sending data from one layer to another, and the weights of these connections are updated according to the error in the result layer, that is, the relationship between the expected result and the obtained result. This process is repeated until the error value is minimal or until a specified interaction value.12,23,24

Deep learning differs from more traditional ML techniques to the extent that it processes more robust computational models with multiple processing layers based on ANNs. Thus, the technique of deep learning works in accordance with an ANN, but it possesses a greater number of hidden layers and, consequently, synaptic connections. Each layer reproduces a representation of data from the previous layer, and the learning algorithm can be either supervised or unsupervised.25,26

Given the high data volume and complexity involved in working with big data, the autoencoder algorithm is a type of ANN that reduces data dimensionality. In order to do this, the algorithm uses mathematical models with a high degree of abstraction to generate a new dataset with reduced dimensionality and representation as close as possible to the input data. The fundamental difference between an ANN and an autoencoder is that the latter uses unlabeled data during the training phase.27

The decision tree algorithm is most used when the dataset is relatively small, and it is developed with a series of yes/no questions to classify data into categories. This algorithm uses a statistical model for data classification or prediction, using the idea of nodes. Each node (question) is divided into possible outcomes, and they branch into other possibilities; this is repeated until the final outcome.16 The main advantages of this algorithm are its simplicity and intuitive interpretation.28

Random forests are an extension of the decision tree algorithm, and they are widely used to solve classification and regression problems. Decision trees are combined, and each one is trained independently. Its main features are simple theory, fast data analysis, stability in the presence of excessive noise, and an automatic compensation mechanism for biased data samples.29

A Bayesian network is another technique that is widely applied to medicine. It consists of Bayesian statistical methods based on the theoretical foundation that consistent subjective beliefs of specialists in a given area can be expressed in a probabilistic structure.17

SVM is a supervised ML method that is widely used in bioinformatics. This algorithm uses the idea of error minimization, working with the statistical theory of learning and optimization. In addition to binary classification, SVM can be used in continuous data regression, called support vector regression. The results obtained with the use of SVM are comparable to those of ANNs, presenting an easy training process and working with high data dimensionality. It, therefore, reaches a compromise between less complexity and error.30,31

In this manner, each algorithm applies different techniques regarding how to learn from observations and how to carry out mapping of a set of predictors for the final result. It must generalize information so that a task can be performed correctly with new inputs that have not been previously analyzed by the model.14

Machine learning in medicine

Since the past century, researchers have been exploring different applications of ML techniques in all fields of medicine.32 Medical research involving ML has grown exponentially over the past few decades. Data from PubMed (NCBI) and Medline, involving the descriptors “machine learning,” “artificial intelligence,” “unsupervised learning,” “supervised learning,” and “neural networks,” revealed 113,127 articles published between 1951 and 2019 (Figure 3). When the descriptor “cardiology” was added as a mandatory condition in the search for the other terms, 888 studies were found, with distribution similar to the previous one, between the years 1986 and 2019.

Figure 3. Number of articles per year and cumulative during the period from 1951 to 2019 in PubMed and Medline.

Figure 3

The capability of ML algorithms to recognize patterns and predict diagnoses has been widely applied to different areas of healthcare.3336 In dermatology, an ANN was able to differentiate dermatological lesions as benign versus malignant, based on more than 129,000 cases, with results similar to those of a committee of 21 dermatologists.35 In the field of psychiatry, a study with ML techniques reduced the number of diagnostic criteria from 29 to 8, with 100% accuracy in 612 patients with confirmed diagnosis of autistic spectrum disorder.36

The addition of mobile technologies, such as smartphones and smartwatches, applied to the area of healthcare has added another dimension to ML, making it possible to read large quantities of personal data in learning algorithms.37 Within feedback systems, mobile technology is able to be a biometric device (for example, measuring blood glucose levels), capable of targeting real-time clinical interventions, based on algorithms that continuously update patients’ personal information.38 Technology is able to simplify diagnostic processes and facilitate clinical practice.

Machine learning in cardiology

Advances in computational capacity in recent decades have especially impacted the field of detection and prediction of cardiovascular diseases through interpretation of data, such as studies of medical records; imaging exams; and biological, genomic, and molecular evaluation databanks.32 Cardiology is one of the areas with the greatest impact on scientific production using ML techniques (Table 2). From the prediction of cardiovascular events39 to the improvement of electrocardiographic and imaging diagnoses,40,41 AI has been an important tool for scientific research.

Table 2. Articles on the use of machine learning in cardiology.

Article Main results
Can machine-learning improve cardiovascular risk prediction using routine clinical data?38 The algorithm was able to predict 4998 of 7404 positive cases (sensitivity 67.5%, PPV 18.4%) and 53,458 of 75,585 negative cases (specificity 70.7% and NPV 95.7%), with a gain of 355 patients (+7.6%) who developed cardiovascular diseases, compared to the traditional method.
Deep neural networks can predict mortality from 12-lead electrocardiogram voltage data43 By means of isolated analysis of ECG using a ML algorithm, it was possible to predict 1-year all-cause mortality with AUC = 0.84 and p < 0.05.
Phenomapping for the Identification of Hypertensive Patients with the Myocardial Substrate for Heart Failure with Preserved Ejection Fraction56 A group of 1273 patients with hypertension was evaluated using ML techniques, using clinical, laboratory, and echocardiography data. It was possible to identify a group of patients at a higher risk of developing heart failure with preserved ejection fraction who were likely to benefit from more intensive medical treatment.
Cognitive Machine-Learning Algorithm for Cardiac Imaging: A Pilot Study for Differentiating Constrictive Pericarditis From Restrictive Cardiomyopathy57 They used ML techniques to differentiate constrictive pericarditis from restrictive cardiomyopathy with a ROC curve of 96.2% and accuracy greater than 90%.
Structured learning algorithm for detection of nonobstructive and obstructive coronary plaque lesions from computed tomography angiography58 The ML algorithm was able to detect coronary lesions greater than or equal to 25% with 93% sensitivity, 95% specificity, and 94% accuracy in 42 coronary angiographies.
A deep neural network learning algorithm outperforms a conventional algorithm for emergency department electrocardiogram interpretation54 Automatic analysis using the ML method for reading ECG in an emergency department obtained sensitivity (88.7% versus 92.0%, p < 0.086), specificity (94% versus 84.7%, p < 0.0001), PPV (88.2% versus 75.4%, p < 0.0001), and accuracy (92.2% versus 87.2%, p < 0.0001), compared to the conventional automatic method.
Automatic Diagnosis of the Short-Duration 12-Lead ECG using a Deep Neural Network: the CODE Study53 A trained neural network was able to detect 6 classes of electrocardiographic abnormalities with specificity greater than 99% and performance greater than 80%, compared to last-year cardiology residents.
An artificial intelligence-enabled ECG algorithm for the identification of patients with atrial fibrillation during sinus rhythm: a retrospective analysis of outcome prediction55 ML software was able to detect patients with atrial fibrillation, based on ECG in sinus rhythm, with a sensitivity of 79%, specificity of 79.5%, and accuracy of 79.4%.

ECG: electrocardiogram; ML: machine learning; NPV: negative predictive value; PPV: positive predictive value.

Prognosis

Several cardiovascular risk scores have been developed in order to predict cardiovascular events and identify individuals with higher cardiac risks, for primary prevention.42 However, in spite of all the advances in diagnostic workup and therapy in cardiology, there is still a population at risk that is has not been identified by traditional methods.43 It is desirable to recognize potential non-traditional risk factors, and the use of new technologies, such as AI, has become a promising method in this search.

The prediction of all-cause mortality over a 1-year period, based on isolated analysis of electrocardiogram (ECG) has shown promising results (AUROC 0.87; p < 0.05).44 It is interesting to underscore that a blind analysis of the same ECGs by 3 cardiologists suggested that the patterns which ML found to predict mortality were not apparently visible on conventional medical assessment.44

In a study including 2619 patients who underwent computerized tomography with proton emission for prediction of cardiovascular risk, ML techniques showed better results (AUROC 0.81; p < 0.01) than isolated analysis of the exam.45

A study with more than 380,000 patients in the United Kingdom evaluated the use of ML techniques to predict the risk of cardiovascular events in comparison with the traditional algorithms proposed by the American College of Cardiology and the American Heart Association.39 There was an improvement of up to 7.6% in the prediction of events with the use of ANN. Some clinical variables that are not valued for cardiovascular disease by traditional methods, such as depression and corticosteroid use, were important to cardiovascular risk assessed by ML techniques39. This finding was corroborated by a multicenter study from the United States where the parameters found for cardiovascular risk prediction differed from those included in traditional risk calculators.46

AI can contribute to the generation of more complex and specific predictive models for each individual,47 by incorporating genomic components in cardiovascular risk scores.48,49 The association of clinical, social, demographic, and genetic data with the available exams can allow more individualized assessment, with the aim of health promotion.47

Diagnosis

In cardiac exams, the need for a highly specialized medical team a variability of reports among physicians, and time spent on reports have led to the study of ML techniques as a diagnostic tool.41,50

The studies have been promising, and cardiac imaging modalities such as echocardiography, computed tomography, and nuclear magnetic resonance have shown good accuracy in correlating structural changes with the etiology and pathophysiology of cardiovascular diseases.51,52 In a study with 159 patients, 3 ML techniques were used to aid in the echocardiographic differentiation between hypertrophic cardiomyopathy and physiological hypertrophy in athletes. The parameters found, such as early-to-late transmitral diastolic velocity ratio (p < 0.01), early diastolic velocity (e’) (p < 0.01), and strain analysis (p < 0.01), were better in sensitivity and specificity than those that are traditionally used.51

A ML algorithm was developed to differentiate intermediate coronary stenosis on angiography with fractional flow reserve less than 0.80 versus greater than 0.80, based on clinical and angiography data. The results were satisfactory, with an accuracy of approximately 80% for prediction of fractional flow reserve less than 0.8 (AUROC 0.84 to 0.87, 95% CI 0.71 to 0.89). The external validation of the developed model also showed similar results in 79 patients from 2 other centers (AUROC 0.89, 95% CI 0.83 to 0.95).53

In relation to ECG, studies are being developed to improve automatic diagnoses.41 By means of ML techniques, our group has been able to identify 6 ECG classes through 12-lead ECG analysis, with good accuracy, comparable to the performance of last-year cardiology residents.54 In hospitalized patients with cardiovascular emergencies, ML had diagnostic accuracy of about 90% for major ECG changes.54 Furthermore, a recent study was able to identify patients with atrial fibrillation on ECG in sinus rhythm with a sensitivity of 79%, specificity of 79.5%, and accuracy of 79.4%.55

Limits and challenges

The use of ML techniques is growing, due to their potential to solve problems in different areas. In medicine, the results have been promising in several specialties, with the expectation that AI can be a tool to assist clinical practice.3,59 Nevertheless, it is still necessary to be cautious when interpreting and incorporating the results.

The ML algorithms developed must be reproducible in the general population. Studies with small numbers of patients, in specific populations, or with selection biases do not allow for generalization of their findings.60,61 Even though data capture and interpretation have considerable statistical value, the best scenarios are still not capable of predicting the outcome in different people.62

An error in an automated process can lead professionals to incorrect conclusions, as demonstrated in a study with 30 internal medicine residents whose diagnostic accuracy for ECG reports was reduced when they were provided with incorrect automatic reports.63

Some doctors have viewed the advancement of AI in medicine with concern. The alarmist position that ML might replace doctors in healthcare has proved to be unjustified. No software, so far, has been able to replace the subjective aspect of clinical experience in making favorable decisions for the patient, precisely because medicine is not an exact science.64 The denial of technological advancement and the AI tools that are available today is as potentially damaging as total dependence on ML for patient care. The combination of ML and clinical judgment has shown better results together than its isolated application.59

Conclusion

The use of ML techniques in medicine has left the field of theory and gone on to become a reality. Although the use of ML in medicine is still in development, studies have demonstrated its clinical applicability, with an impact on diagnostic and prognostic evaluation.

Funding Statement

Ribeiro AL is partially supported by CNPq (310679/2016-8 and 465518/2014-1) and by FAPEMIG (PPM-00428-17 and RED-00081-16). Moraes JL is supported by the CNPq (141286/2021-0).

Footnotes

Sources of Funding

Ribeiro AL is partially supported by CNPq (310679/2016-8 and 465518/2014-1) and by FAPEMIG (PPM-00428-17 and RED-00081-16). Moraes JL is supported by the CNPq (141286/2021-0).

Study Association

This article is part of the thesis of Doctoral submitted by Gabriela Miana de Mattos Paixão, from Universidade Federal de Minas Gerais.


Articles from Arquivos Brasileiros de Cardiologia are provided here courtesy of Sociedade Brasileira de Cardiologia

RESOURCES