============================================================ HADACA3 - XGBoost Deconvolution Model ============================================================ 📂 Cargando dataset desde cache: c:\Users\herra\Documents\DataCamp\Hadaka\Solution\data\dataset_cache.pkl ✓ Cargado desde cache ============================================================ 📊 ANÁLISIS DE DISTRIBUCIÓN DE PROPORCIONES ============================================================ Tipo Media Std Min Max CV% ---------------------------------------------------- endo 0.1481 0.0821 0.0105 0.4303 55.5% fibro 0.4357 0.1067 0.1844 0.6887 24.5% immune 0.1061 0.0828 0.0022 0.5362 78.0% classic 0.2251 0.1268 0.0000 0.5094 56.3% basal 0.0850 0.0923 0.0000 0.3427 108.6% 🔍 Detección de problemas: basal: alta variabilidad Correlación entre tipos celulares: classic <-> basal: -0.669 📊 Dataset combinado: 75 muestras ============================================================ 🚀 Entrenando modelo XGBoost de deconvolución ============================================================ 📊 Features: 39,632 (15,908 RNA + 23,724 MET) 📊 Muestras de entrenamiento: 60 📊 Tipos celulares: ['endo', 'fibro', 'immune', 'classic', 'basal'] 🔧 Entrenando 5 modelos en paralelo... endo: RMSE (train) = 0.0560 fibro: RMSE (train) = 0.0555 immune: RMSE (train) = 0.0612 classic: RMSE (train) = 0.0559 basal: RMSE (train) = 0.0497 ✅ Modelo entrenado exitosamente ============================================================ 📊 MÉTRICAS DE EVALUACIÓN ============================================================ RMSE global: 0.0509 MAE global: 0.0393 R² global: 0.8842 RMSE por tipo celular: endo: 0.0457 fibro: 0.0485 immune: 0.0443 classic: 0.0576 basal: 0.0569 ============================================================ 🔄 Validación Cruzada (10 folds) ============================================================ 🔄 Validación cruzada (10 folds, paralelo)... Fold 1: RMSE = 0.0377 Fold 2: RMSE = 0.0590 Fold 3: RMSE = 0.0635 Fold 4: RMSE = 0.0745 Fold 5: RMSE = 0.0348 Fold 6: RMSE = 0.0894 Fold 7: RMSE = 0.0615 Fold 8: RMSE = 0.0740 Fold 9: RMSE = 0.0653 Fold 10: RMSE = 0.0375 📊 RMSE promedio: 0.0597 (±0.0172) ============================================================ 🔍 Top 20 Features más importantes ============================================================ feature importance 16505 met_cg00685836 0.046521 16392 met_cg00551244 0.032876 24352 met_cg10001720 0.029610 39518 met_cg27525902 0.026904 16524 met_cg00706536 0.026090 38700 met_cg26537639 0.025869 24297 met_cg09923855 0.025463 27887 met_cg14049461 0.025035 16951 met_cg01200060 0.024188 15909 met_cg00003994 0.023537 32546 met_cg19423311 0.023043 21402 met_cg06489418 0.022661 32141 met_cg18950617 0.022191 21674 met_cg06792911 0.021980 31694 met_cg18414950 0.021196 32190 met_cg19002579 0.021165 16250 met_cg00403724 0.020189 39603 met_cg27631256 0.020174 24817 met_cg10523671 0.020039 19826 met_cg04561804 0.019756 💾 Guardando modelo en: c:\Users\herra\Documents\DataCamp\Hadaka\Solution\models\xgb_deconvolution_model.pkl ============================================================ ✅ Proceso completado ⏱️ Tiempo de ejecución: 2m 55.09s ============================================================