Dans Enterprise Miner, comment sont gérées les variables manquantes ? Généralement (sauf dans le noeud « Arbre de Décision »), les observations comportant au moins une valeur manquante sont exclues de l’analyse. On peut choisir de les compléter au préalable avec le nœud Replacement, ou avec un nœud SAS Code faisant appel à la PROC MI. Dans le nœud Arbre de Décision, on peut utiliser la valeur manquante comme une valeur à part entière, ou exclure les observations incomplètes comme dans […]
Les réseaux de neurones de SEM comprennent-ils toujours une seule couche cachée ? On peut forcer le nombre de couches cachées, pour cela il faut aller dans l’interface avancée (cocher ADVANCED USER INTERFACE dans l’onglet GENERAL) et cliquer droit n’importe où : on a la fonctionnalité ADD HIDDEN LAYER qui doit être disponible. Relier comme on le souhaite les couches.
Je me pose des questions sur la sélection de variables sous SEM : en effet le test du chi-deux proposé ne semble pas correspondre au test du chi-deux sous SAS (PROC FREQ avec option CHISQ). Qu’en est-il vraiment? je suis allée voir ce que faisait SEM dans le Program Editor et il fait une PROC DMSPLIT : qu’est-ce que c’est que cette PROC ? Dans quel module est-elle disponible ? En fait, le nœud VARIABLE SELECTION construit un arbre […]
Bonjour, Sous EM, le modele LOGIT prend-t-il en compte les formats ou doit-on recoder en dur les modalités ? A priori, si un format est attaché de manière permanente à la variable, SEM le prend en compte dans tout son diagramme. Pour le vérifier, vous pouvez aller dans le nœud INPUT DATA SOURCE, et faire un VIEW DISTRIBUTION de votre variable formatée. Si les catégories affichées correspondent au format, le nœud REGRESSION en tiendra compte. Sinon, vous devez coder […]
Bonjour, Dans SEM, et plus précisément dans le noeud Input Data Source, est-il possible d’enregistrer le paramétrage (notamment « Model role » et « Measurement »), puis de l’appliquer sur une nouvelle table (ou une mise à jour de la table) sans avoir à tout redéfinir? J’ai une table de départ de plus de 400 variables et j’essaie d’éviter de tout redéfinir à chaque nouvelle version de la table. Merci d’avance. Il existe la possibilité de cloner le noeud Input Data Source (IDS). […]
Bonjour, J’aimerais savoir pour quelle raison statistique l’icone variable selection d’EM découpe les variables continues en 16 classes. Pourquoi 16 ? L’option de découpage des variables continues en 16 classes (notée AOV16 dans l’interface de Variable Selection) permet de travailler avec des classes. Ces classes peuvent amener à détecter une liaison non linéaire entre la cible et une variable explicative ainsi découpée, en dépit du fait que le critère de sélection est le R². Le nombre de 16 a […]
Bonjour, Je voudrais savoir si vous connaissez une procédure sas qui permet de faire de la discrétisation supervisée du type MDLPC ou autre? merci Bonjour. Dans SAS, les seuls instruments disponibles pour la discrétisation supervisées se trouvent dans le module Enterprise Miner (extrêmement coûteux) ; si vous pouvez l’utiliser, vous trouverez votre bonheur avec l’outil TRANSFORM qui propose une transformation appelée « OPTIMAL BINNING » à base d’analyse de variance. Pour ce qui est du MDLPC, ce qui s’en rapproche le […]
Je souhaiterais réaliser une classification à l’aide de variables qualitatives. Je dispose de SAS Enterprise Miner et je souhaiterais savoir si ce dernier peut me réaliser ma classification. Et si oui, comment ? SEM est un peu borné côté variables qualitatives. L’idée serait de lui fournir des variables quanti qui racontent la même chose. Pour ça, il faudrait faire une ACM (proc CORRESP) dans un nœud SAS Code par exemple…
Dans l’onglet basic>multiplayer perceptron il y a une case « hidden neurons ». Cette case nous permet-elle de choisir le nombre de neurones dans la seule couche cachée ou le nombre de couches cachées ?
Dans l’onglet Basic du noeud Neural Networks à quoi correspondent « preliminary runs » et « training technique » ? Est-t-il important de les paramétrer ?
Quel fonction de transfert utilise SEM pour les réseaux de neurone ? la logistique ?
Dans la sortie (output), à quoi correspond la table « weights » ? (on a des H11 – H12… cela correspond-il aux noeuds) et comment analyse-t-on le graph dans cet onglet (weight) ?
J’ai besoin d’utiliser les réseaux de neurones sous SEM.
Tout d’abord peut-t-on utiliser une variable « target » avec plusieurs modalités?
Je n’ai pas de problèmes pour les lancer mais je ne sais pas trop comment les interpréter, à part le « misclassification rate »… Dans l' »output validation data », il n’y a pas de variables permettant de savoir où les individus ont été classés…
Je ne trouve pas la même note de score que SEM lors de la régression… En fait moi je considère que quand par exemple sur une variable à 2 modalités l’individu a la modalité 2 le coefficient de cette modalité 2 est égal à zéro alors que SEM prend comme coeff -(le coeff de la modalité 1)…
Exemple pour la variable détention de sécurité12, on a 2 modalités sec1 et sec2.. Sur la grille des coefficients, le coeff de sec1=0.23 et dans ce cas si un individu a la modalité 2, SEM va lui mettre un coeff de -0.23 alors que moi je lui mettrais zéro…
Ma question est : de quelle théorie sort-il cette règle? et qu’est ce que ça change et qui a raison?
Je voudrais changer le répertoire dans lequel se trouve mon projet SEM (déjà assez volumineux). Quels fichiers dois-je transférer ?
Comment est ce que je peux récupérer facilement la note du score créé par SEM pour chaque client ?
Est-ce normal que pour 100 000 lignes, SEM indique le message d’erreur suivant : out of resources ?
Je voudrais faire une régression logistique en utilisant des classes de mes variables quantitatives…
Pour cela je peux utiliser le noeud transform variables et calculer des classes selon les quartiles ou quelque chose du genre mais le problème c’est que j’aimerais faire une classe exclusivement = 0 … car pour les montants par exemple il y en beaucoup qui sont égaux à zéro. Donc je voudrais avoir ma 1ère classe seulement pour des valeurs nulles puis la 2ème par exemple pour des valeurs comprises entre zéro exclus et 12000 F…
Comment m’y prendre ?
Bonjour, pouvez -vous me donner les caractéristiques et les différences entre les logiciels Sas Guide et Sas Entreprise Miner?
Peut on faire des scores avec Sas Guide?
Je souhaiterai savoir comment faire un échantillonnage stratifié (sur une ou plusieurs variables qualitatives) avec la PROC SURVEYLECT comme le fait le noeud SAMPLING de SEM.
Dans SEM, un point me pose problème : est ce qu’il a moyen de prendre comme critère le fait de maximiser le taux de détention=1. Je m’explique: en fait le score que j’ai obtenu a un bon taux global mais en fait je me suis rendue compte que peu de gens avaient une note de score élevé ce qui correspondrait au fait que le taux de détention=0 bien classés est supérieur à celui de détention=1 alors que j’aimerais favoriser le 2ème taux…
Quand je spécifie une probabilité a priori (Prior proba) dans un noeud Tree, il prend cette proba pour l’échantillon d’apprentissage, de validation et de test. Or moi, ce que je voudrais, c’est qu’il prenne cette proba pour apprendre et qu’il valide et teste sur un échantillon normal. A part dupliquer les individus à qui je veux donner une plus grande importance, comment résoudre ce problème ?
Je souhaiterais réaliser une classification à l’aide de variables qualitatives. Je dispose de SAS Enterprise Miner et je souhaiterais savoir si ce dernier peut me réaliser ma classification. Et si oui, comment ?
Je voudrais savoir dans mon étude si dans le temps il y a un effet de propagation de différents types d’incidents (3 types).
Comment faire fonctionner le noeud Association de SAS Enterprise Miner ? Que faut-il lui donner comme variables cible et variables d’entrée ?
J’aimerais effectuer un arbre de régression, à savoir un arbre avec une cible quantitative. Cela est-il possible avec Sas EM? Et si oui, comment?
Les arbres de décisions sont-ils possibles avec Sas Guide ou Sas Base?
Les quatre mesures proposées telles BINARY, INTERVAL, NOMINAL ou ORDINAL ne répondent pas au problème de conserver des valeurs entières alors comment puis-je le résoudre ?
Quels sont les critères importants et /ou indispensables à régler pour pouvoir valider mon arbre de décision ?
Dans Enterprise Miner, comment sont gérées les variables manquantes ?
Je voulais savoir comment on pouvait exploiter le programme de l’arbre de décision issu de SEM. En fait SEM semble, comme pour la régression, calculer une probabilité de prise (un score). Je me demande comment est calculée cette proba.
Je me pose des questions sur la sélection de variables sous SEM : en effet le test du chi-deux proposé ne semble pas correspondre au test du chi-deux sous SAS (PROC FREQ avec option CHISQ). Qu’en est-il vraiment? je suis allée voir ce que faisait SEM dans le Program Editor et il fait une PROC DMSPLIT : qu’est-ce que c’est que cette PROC ? Dans quel module est-elle disponible ?
Quand je spécifie une probabilité a priori (Prior proba) dans un noeud Tree, il prend cette proba pour l’échantillon d’apprentissage, de validation et de test. Or moi, ce que je voudrais, c’est qu’il prenne cette proba pour apprendre et qu’il valide et teste sur un échantillon normal. A part dupliquer les individus à qui je veux donner une plus grande importance, comment résoudre ce problème ?
Est-ce qu’il faut que ma variable retour soit codée 0/1 ou bien est-ce que le codage 1 et . (valeur manquante) est accepté ?