Mario Olimpio de MenezesMENDES, PATRICIA P.M.2023-07-282023-07-282023MENDES, PATRICIA P.M. <b>Modelo preditivo de infecção hospitalar utilizando aprendizado de máquina</b>. Orientador: Mario Olimpio de Menezes. 2023. 99 f. Dissertação (Mestrado em Tecnologia Nuclear) - Instituto de Pesquisas Energéticas e Nucleares - IPEN-CNEN/SP, São Paulo. DOI: <a href="https://dx.doi.org/10.11606/D.85.2023.tde-12072023-091827">10.11606/D.85.2023.tde-12072023-091827</a>. Disponível em: http://repositorio.ipen.br/handle/123456789/34174.http://repositorio.ipen.br/handle/123456789/34174Cada vez mais o aprendizado de máquina vem ganhando espaço na área da saúde devido à sua capacidade de melhorar a predição de doenças e auxiliar profissionais na condução dos tratamentos clínicos. A infecção hospitalar é o evento negativo mais comum para pacientes hospitalizados e continua a se constituir em séria ameaça à segurança dos pacientes. O objetivo deste trabalho foi encontrar uma técnica de aprendizado de máquina otimizada e eficiente que possa prever efetivamente a condição da infecção hospitalar, identificando os principais fatores responsáveis por esta condição. Neste trabalho, usamos seis técnicas de aprendizado de máquina, os algoritmos utilizados no trabalho foram Random Forest, Regressão logística, KNN, Adaboost, Bagging e XGBoost; também foram empregadas técnicas modernas de explicabilidade a estes algoritmos. Nesse processo, os dados foram divididos em dados de treino e de teste, os modelos foram treinados em um primeiro momento com os hiperparâmetros padrões, em um segundo momento os modelos foram treinados com hiperparâmetros aprimorados. Os modelos que apresentaram as melhores métricas foram o XGBoost e Random Forest, o XGBoost apresentou o melhor resultado em todas as métricas, exceto na Precisão, o Random Forest obteve o segundo melhor resultado na acurácia e na precisão, na validação cruzada o resultado foi o mesmo que o XGBoost. Para a explicabilidade do modelo foi utilizada a biblioteca SHAP, foi avaliado como o valor de cada variável influenciou no resultado alcançado pelo modelo preditivo XGBoost, SHAP apontou como mais importante as variáveis: NR_DIA_INTERNADO (quantidade de dias de internação), CD_DOENCA_PRINCIPAL_E (CID-10 Classificação internacional de doenças), DS_PROC_PRINCIPAL_E (Procedimento principal durante internação) e QT_DIAS_SONDA_VESICAL (Dias que o paciente ficou com sonda vesical). O estudo mostrou-se viável à adoção de aprendizado de máquina nas rotinas da pesquisa em saúde, no trabalho da comissão de infecção hospitalar e nas iniciativas de inovação nas instituições de saúde no Brasil.99openAccesslearningman-machine systemshealth servicessterilizationclinical trialsdecision makingartificial intelligenceModelo preditivo de infecção hospitalar utilizando aprendizado de máquinaPredictive model of nosocomil infection using machine learningDissertação10.11606/D.85.2023.tde-12072023-091827