logo

Enterprise Miner

Enterprise Miner : Valeurs manquantes

Dans Enterprise Miner, comment sont gérées les variables manquantes ?   Généralement (sauf dans le noeud « Arbre de Décision »), les observations comportant au moins une valeur manquante sont exclues de l’analyse. On peut choisir de les compléter au préalable avec le nœud Replacement, ou avec un nœud SAS Code faisant appel à la PROC MI. Dans le nœud Arbre de Décision, on peut utiliser la valeur manquante comme une valeur à part entière, ou exclure les observations incomplètes comme dans […]

Enterprise Miner : Structure des réseaux de neurones

Les réseaux de neurones de SEM comprennent-ils toujours une seule couche cachée ?   On peut forcer le nombre de couches cachées, pour cela il faut aller dans l’interface avancée (cocher ADVANCED USER INTERFACE dans l’onglet GENERAL) et cliquer droit n’importe où : on a la fonctionnalité ADD HIDDEN LAYER qui doit être disponible. Relier comme on le souhaite les couches.

Enterprise Miner : Sélection de variables avec le Chi-2

Je me pose des questions sur la sélection de variables sous SEM : en effet le test du chi-deux proposé ne semble pas correspondre au test du chi-deux sous SAS (PROC FREQ avec option CHISQ). Qu’en est-il vraiment? je suis allée voir ce que faisait SEM dans le Program Editor et il fait une PROC DMSPLIT : qu’est-ce que c’est que cette PROC ? Dans quel module est-elle disponible ?   En fait, le nœud VARIABLE SELECTION construit un arbre […]

Enterprise Miner : Prise en compte des formats (modèle LOGIT)

Bonjour, Sous EM, le modele LOGIT prend-t-il en compte les formats ou doit-on recoder en dur les modalités ?   A priori, si un format est attaché de manière permanente à la variable, SEM le prend en compte dans tout son diagramme. Pour le vérifier, vous pouvez aller dans le nœud INPUT DATA SOURCE, et faire un VIEW DISTRIBUTION de votre variable formatée. Si les catégories affichées correspondent au format, le nœud REGRESSION en tiendra compte. Sinon, vous devez coder […]

Enterprise Miner : Paramétrage du noeud Input Data Source

Bonjour, Dans SEM, et plus précisément dans le noeud Input Data Source, est-il possible d’enregistrer le paramétrage (notamment « Model role » et « Measurement »), puis de l’appliquer sur une nouvelle table (ou une mise à jour de la table) sans avoir à tout redéfinir? J’ai une table de départ de plus de 400 variables et j’essaie d’éviter de tout redéfinir à chaque nouvelle version de la table. Merci d’avance.   Il existe la possibilité de cloner le noeud Input Data Source (IDS). […]

Enterprise Miner : Variable sélection

Bonjour, J’aimerais savoir pour quelle raison statistique l’icone variable selection d’EM découpe les variables continues en 16 classes. Pourquoi 16 ?   L’option de découpage des variables continues en 16 classes (notée AOV16 dans l’interface de Variable Selection) permet de travailler avec des classes. Ces classes peuvent amener à détecter une liaison non linéaire entre la cible et une variable explicative ainsi découpée, en dépit du fait que le critère de sélection est le R². Le nombre de 16 a […]

Enterprise Miner : Discrétisation supervisée

Bonjour, Je voudrais savoir si vous connaissez une procédure sas qui permet de faire de la discrétisation supervisée du type MDLPC ou autre? merci   Bonjour. Dans SAS, les seuls instruments disponibles pour la discrétisation supervisées se trouvent dans le module Enterprise Miner (extrêmement coûteux) ; si vous pouvez l’utiliser, vous trouverez votre bonheur avec l’outil TRANSFORM qui propose une transformation appelée « OPTIMAL BINNING » à base d’analyse de variance. Pour ce qui est du MDLPC, ce qui s’en rapproche le […]

Enterprise Miner : Classification sur variables qualitatives avec SEM

Je souhaiterais réaliser une classification à l’aide de variables qualitatives. Je dispose de SAS Enterprise Miner et je souhaiterais savoir si ce dernier peut me réaliser ma classification. Et si oui, comment ?   SEM est un peu borné côté variables qualitatives. L’idée serait de lui fournir des variables quanti qui racontent la même chose. Pour ça, il faudrait faire une ACM (proc CORRESP) dans un nœud SAS Code par exemple…

Enterprise Miner : Couches cachées (SEM, Neural Network)

Dans l’onglet basic>multiplayer perceptron il y a une case « hidden neurons ». Cette case nous permet-elle de choisir le nombre de neurones dans la seule couche cachée ou le nombre de couches cachées ?

Enterprise Miner : Paramétrer les réseaux de neurones

Dans l’onglet Basic du noeud Neural Networks à quoi correspondent « preliminary runs » et « training technique » ? Est-t-il important de les paramétrer ?

Enterprise Miner : Fonction de transfert des réseaux de neurones

Quel fonction de transfert utilise SEM pour les réseaux de neurone ? la logistique ?

Enterprise Miner : Lire les sorties des réseaux de neurones

Dans la sortie (output), à quoi correspond la table « weights » ? (on a des H11 – H12… cela correspond-il aux noeuds) et comment analyse-t-on le graph dans cet onglet (weight) ?

Enterprise Miner : Aide SEM

Y a t’il une aide sous SEM ?

Enterprise Miner : Réseaux de neurones, mode d’emploi ?

J’ai besoin d’utiliser les réseaux de neurones sous SEM.
Tout d’abord peut-t-on utiliser une variable « target » avec plusieurs modalités?
Je n’ai pas de problèmes pour les lancer mais je ne sais pas trop comment les interpréter, à part le « misclassification rate »… Dans l' »output validation data », il n’y a pas de variables permettant de savoir où les individus ont été classés…

Enterprise Miner : Scoring à partir d’une régression

Je ne trouve pas la même note de score que SEM lors de la régression… En fait moi je considère que quand par exemple sur une variable à 2 modalités l’individu a la modalité 2 le coefficient de cette modalité 2 est égal à zéro alors que SEM prend comme coeff -(le coeff de la modalité 1)…
Exemple pour la variable détention de sécurité12, on a 2 modalités sec1 et sec2.. Sur la grille des coefficients, le coeff de sec1=0.23 et dans ce cas si un individu a la modalité 2, SEM va lui mettre un coeff de -0.23 alors que moi je lui mettrais zéro…
Ma question est : de quelle théorie sort-il cette règle? et qu’est ce que ça change et qui a raison?

Enterprise Miner : Migration de projet SEM

Je voudrais changer le répertoire dans lequel se trouve mon projet SEM (déjà assez volumineux). Quels fichiers dois-je transférer ?

Enterprise Miner : Scoring individuel

Comment est ce que je peux récupérer facilement la note du score créé par SEM pour chaque client ?

Enterprise Miner : Capacités

Est-ce normal que pour 100 000 lignes, SEM indique le message d’erreur suivant : out of resources ?

Enterprise Miner : Classes sous SEM

Je voudrais faire une régression logistique en utilisant des classes de mes variables quantitatives…
Pour cela je peux utiliser le noeud transform variables et calculer des classes selon les quartiles ou quelque chose du genre mais le problème c’est que j’aimerais faire une classe exclusivement = 0 … car pour les montants par exemple il y en beaucoup qui sont égaux à zéro. Donc je voudrais avoir ma 1ère classe seulement pour des valeurs nulles puis la 2ème par exemple pour des valeurs comprises entre zéro exclus et 12000 F…
Comment m’y prendre ?

Enterprise guide : différence entre SAS guide et SAS entreprise miner

Bonjour, pouvez -vous me donner les caractéristiques et les différences entre les logiciels Sas Guide et Sas Entreprise Miner?
Peut on faire des scores avec Sas Guide?

Echantillon : Comment réaliser un échatillon stratifié comme avec SEM avec la PROC SURVEYSELECT

Je souhaiterai savoir comment faire un échantillonnage stratifié (sur une ou plusieurs variables qualitatives) avec la PROC SURVEYLECT comme le fait le noeud SAMPLING de SEM.

Echantillon : Mon score apprend mal !

Dans SEM, un point me pose problème : est ce qu’il a moyen de prendre comme critère le fait de maximiser le taux de détention=1. Je m’explique: en fait le score que j’ai obtenu a un bon taux global mais en fait je me suis rendue compte que peu de gens avaient une note de score élevé ce qui correspondrait au fait que le taux de détention=0 bien classés est supérieur à celui de détention=1 alors que j’aimerais favoriser le 2ème taux…

Echantillon : Probabilités a priori

Quand je spécifie une probabilité a priori (Prior proba) dans un noeud Tree, il prend cette proba pour l’échantillon d’apprentissage, de validation et de test. Or moi, ce que je voudrais, c’est qu’il prenne cette proba pour apprendre et qu’il valide et teste sur un échantillon normal. A part dupliquer les individus à qui je veux donner une plus grande importance, comment résoudre ce problème ?

Classification : Classification sur variables qualitatives avec SEM

Je souhaiterais réaliser une classification à l’aide de variables qualitatives. Je dispose de SAS Enterprise Miner et je souhaiterais savoir si ce dernier peut me réaliser ma classification. Et si oui, comment ?

Association : Noeud « Association » de SEM avec l’option sequence

Je voudrais savoir dans mon étude si dans le temps il y a un effet de propagation de différents types d’incidents (3 types).

Association : Noeud Association

Comment faire fonctionner le noeud Association de SAS Enterprise Miner ? Que faut-il lui donner comme variables cible et variables d’entrée ?

Arbre de décision : Arbre de régression

J’aimerais effectuer un arbre de régression, à savoir un arbre avec une cible quantitative. Cela est-il possible avec Sas EM? Et si oui, comment?
Les arbres de décisions sont-ils possibles avec Sas Guide ou Sas Base?

Arbre de décision : EM – Problème de variables numériques discrètes lors de modélisation

Les quatre mesures proposées telles BINARY, INTERVAL, NOMINAL ou ORDINAL ne répondent pas au problème de conserver des valeurs entières alors comment puis-je le résoudre ?

Arbre de décision : Niche d’individus.

Probleme de discrimination

Arbre de décision : Paramétrage et lecture d’un arbre de décision

Quels sont les critères importants et /ou indispensables à régler pour pouvoir valider mon arbre de décision ?

Arbre de décision : Valeurs manquantes sous SEM

Dans Enterprise Miner, comment sont gérées les variables manquantes ?

Arbre de décision : Score d’un arbre de décision

Je voulais savoir comment on pouvait exploiter le programme de l’arbre de décision issu de SEM. En fait SEM semble, comme pour la régression, calculer une probabilité de prise (un score). Je me demande comment est calculée cette proba.

Arbre de décision : Sélection de variables avec le Chi-2

Je me pose des questions sur la sélection de variables sous SEM : en effet le test du chi-deux proposé ne semble pas correspondre au test du chi-deux sous SAS (PROC FREQ avec option CHISQ). Qu’en est-il vraiment? je suis allée voir ce que faisait SEM dans le Program Editor et il fait une PROC DMSPLIT : qu’est-ce que c’est que cette PROC ? Dans quel module est-elle disponible ?

Arbre de décision : Probabilités a priori

Quand je spécifie une probabilité a priori (Prior proba) dans un noeud Tree, il prend cette proba pour l’échantillon d’apprentissage, de validation et de test. Or moi, ce que je voudrais, c’est qu’il prenne cette proba pour apprendre et qu’il valide et teste sur un échantillon normal. A part dupliquer les individus à qui je veux donner une plus grande importance, comment résoudre ce problème ?

Arbre de décision : Codage de la cible sous Enterprise Miner

Est-ce qu’il faut que ma variable retour soit codée 0/1 ou bien est-ce que le codage 1 et . (valeur manquante) est accepté ?