Astronomie

Comment estimez-vous l'erreur sur la hauteur/largeur d'une gaussienne ?

Comment estimez-vous l'erreur sur la hauteur/largeur d'une gaussienne ?

J'essaie d'adapter des gaussiennes à plusieurs raies d'un spectre que j'ai. Certains d'entre eux se chevauchent, ce qui empêche le programme d'ajustement que j'utilise de donner des estimations raisonnables des erreurs sur les mesures. Par exemple, cela donnera parfois la largeur de la raie spectrale à 0,5 GHz mais donnera l'incertitude à 1 000 GHz.

Pour résoudre ce problème, j'ai fait des estimations manuelles sur ceux qu'il ne peut pas obtenir. J'ai lu que vous pouvez estimer l'erreur sur le pic de la gaussienne avec :

Erreur de crête = (1/2)*(Largeur / Rapport signal/bruit)

mais je ne trouve rien pour la hauteur ou la largeur. Existe-t-il des méthodes similaires pour estimer l'incertitude sur ces mesures ?

Merci.


Si vous connaissez le nombre de fonctions de Gauss qui se chevauchent, vous pouvez les écrire sous la forme $sum_{i=1}^n a_ie^{-(frac{x-mu_i}{sigma_i})^2}$, puis soustraire vos séries temporelles, avec plus de 3$ d'articles, pour réduire le risque d'un problème mal posé. Ensuite, appliquez une méthode de minimisation de la moyenne quadratique (RMS) / des moindres carrés pour déduire les paramètres $3i$. Si votre FWHM, ou $sigma$ est connu pour être le même pour tous les pics, votre nombre de paramètres se réduit à $2i+1$.

Voir aussi le raffinement de Rietveld en tant qu'approche connexe.


Vous pouvez utiliser scipy.optimize.curve_fit : Cette méthode renvoie non seulement les valeurs optimales estimées des paramètres, mais également la matrice de covariance correspondante :

Valeurs optimales pour les paramètres afin que la somme des carrés des résidus de f(xdata, *popt) - ydata soit minimisée

La covariance estimée de popt. Les diagonales fournissent la variance de l'estimation du paramètre. Pour calculer une erreur d'écart type sur les paramètres, utilisez perr = np.sqrt(np.diag(pcov)).

La façon dont le paramètre sigma affecte la covariance estimée dépend de l'argument Absolute_sigma, comme décrit ci-dessus.

Si la matrice jacobienne à la solution n'a pas un rang complet, alors la méthode 'lm' renvoie une matrice remplie de np.inf, d'autre part les méthodes 'trf' et 'dogbox' utilisent le pseudo-inverse de Moore-Penrose pour calculer la covariance matrice.

Vous pouvez calculer les erreurs d'écart-type des paramètres à partir des racines carrées des éléments diagonaux de la matrice de covariance comme suit :


Fonction de distribution gaussienne

Si le nombre d'événements est très grand, alors la fonction de distribution gaussienne peut être utilisée pour décrire les événements physiques. La distribution gaussienne est une fonction continue qui se rapproche de la distribution binomiale exacte des événements.

La distribution gaussienne montrée est normalisée de sorte que la somme sur toutes les valeurs de x donne une probabilité de 1. La nature de la gaussienne donne une probabilité de 0,683 d'être à moins d'un écart type de la moyenne. La valeur moyenne est a=np où n est le nombre d'événements et p la probabilité de toute valeur entière de x (cette expression est issue de la distribution binomiale ). L'expression d'écart type utilisée est également celle de la distribution binomiale.

La distribution gaussienne est aussi communément appelée la « distribution normale » et est souvent décrite comme une « courbe en forme de cloche ».

Ce calcul est conçu pour évaluer la valeur moyenne et l'écart type et pour calculer la valeur de la fonction de distribution si une valeur x est fournie. Par exemple, si vous l'utilisiez pour évaluer 100 lancers de pièces pour le nombre de "faces", alors la probabilité d'un seul lancer de pièces serait de 0,5 et la valeur moyenne des faces pour 100 lancers serait de 50. Mais l'écart type serait de 5, vous devriez donc avoir une probabilité de 0,683 d'avoir entre 45 et 55 faces. La probabilité serait d'environ 0,08 d'avoir exactement 50 têtes. Mais si vous évaluez la valeur de la fonction de distribution pour les valeurs de 45 à 55 et que vous les additionnez, la somme est de 0,7295, donc ce nombre d'événements n'est pas assez grand pour que l'approximation gaussienne donne des résultats précis. L'exécution de la même série de calculs à l'aide de la distribution binomiale donne 0,7287, de sorte qu'aucun des calculs pour cet échantillon de taille ne correspond à la projection gaussienne théorique.


Lors de l'ajustement d'une gaussienne, calculer correctement μ et est un gros problème. Vous avez cité votre référence (merci !), mais ne l'avez pas suivie. Veuillez importer des mathématiques et remplacer ces deux lignes dans votre code :

(Il s'avère que si la moyenne est un nombre compris entre -7200 et 10 000, l'ajustement converge toujours bien, et de même pour les sigmas positifs inférieurs à 805.)

Vous pouvez trouver lmfit (http://lmfit.github.io/lmfit-py/) utile pour ce genre de problème. Il a des modèles intégrés pour les formes de pics courantes comme Gaussian et simplifie de nombreuses tâches d'ajustement de courbe. Votre exemple ressemblerait à ceci (en sautant les données):

qui imprimerait le rapport d'ajustement de

et produire un graphique montrant un bon ajustement.

Notez que la définition de gaussien est légèrement différente et que votre a correspondrait à la valeur de hauteur indiquée ci-dessus. La valeur indiquée comme amplitude serait la zone intégrée.


Les règles de propagation des erreurs s'appliquent aux cas où nous sommes en laboratoire, mais la propagation des erreurs prend du temps. Les règles pour chiffres significatifs permettent une méthode beaucoup plus rapide pour obtenir des résultats approximativement corrects même lorsque nous n'avons pas de valeurs d'incertitude.

Un chiffre significatif est tout chiffre de 1 à 9 et tout zéro qui n'est pas un espace réservé. Ainsi, dans 1.350 il y a 4 chiffres significatifs puisque le zéro n'est pas nécessaire pour donner un sens au nombre. Dans un nombre comme 0,00320, il y a 3 chiffres significatifs -- les trois premiers zéros ne sont que des espaces réservés. Cependant le nombre 1350 est ambigu. Vous ne pouvez pas dire s'il y a 3 chiffres significatifs -- le 0 n'est utilisé que pour tenir la place des unités -- ou s'il y a 4 chiffres significatifs et le zéro à la place des unités a en fait été mesuré comme étant zéro.

Comment résolvons-nous les ambiguïtés qui surviennent avec les zéros lorsque nous devons utiliser le zéro comme espace réservé ainsi qu'un chiffre significatif ? Supposons que nous mesurions une longueur à trois chiffres significatifs comme 8000 cm. Écrit de cette façon, nous ne pouvons pas dire s'il y a 1, 2, 3 ou 4 chiffres significatifs. Pour rendre le nombre de chiffres significatifs apparent, nous utilisons la notation scientifique, 8 x cm (qui a un chiffre significatif), ou 8,00 x cm (qui a trois chiffres significatifs), ou tout ce qui est correct dans les circonstances.

Nous commençons alors avec des nombres ayant chacun leur propre nombre de chiffres significatifs et calculons une nouvelle quantité. Combien de chiffres significatifs doit contenir la réponse finale ? En effectuant des calculs en cours, nous maintenons des nombres à plusieurs chiffres, mais nous devons rapporter la réponse uniquement au nombre approprié de chiffres significatifs.

Dans le cas de l'addition et de la soustraction, nous pouvons mieux expliquer avec un exemple. Supposons qu'un objet soit mesuré pour avoir une masse de 9,9 g et qu'un deuxième objet soit mesuré sur une balance différente pour avoir une masse de 0,3163 g. Quelle est la masse totale ? Nous écrivons les nombres avec des points d'interrogation aux endroits où nous manquons d'informations. Ainsi 9.9. g et 0,3163 ? gm. En les ajoutant avec les points décimaux alignés, nous voyons

Dans le cas de la multiplication ou de la division, nous pouvons utiliser la même idée de chiffres inconnus. Ainsi le produit de 3,413 ? et 2.3 ? peut être écrit à la main comme

La règle courte pour la multiplication et la division est que la réponse contiendra un nombre de chiffres significatifs égal au nombre de chiffres significatifs dans le nombre entrant ayant le plus petit nombre de chiffres significatifs. Dans l'exemple ci-dessus, 2.3 avait 2 chiffres significatifs tandis que 3.413 en avait 4, donc la réponse est donnée à 2 chiffres significatifs.

Il est important de garder ces concepts à l'esprit lorsque vous utilisez des calculatrices avec des affichages à 8 ou 10 chiffres si vous voulez éviter les erreurs dans vos réponses et éviter la colère des professeurs de physique du monde entier. Une bonne procédure à utiliser consiste à utiliser tous les chiffres (significatifs ou non) tout au long des calculs, et à arrondir uniquement les réponses au "sig fig" approprié.

Problème: Combien y a-t-il de chiffres significatifs dans chacun des éléments suivants ? Répondre

(i) 0,00042 (ii) 0,14700 (ii) 4,2 x (iv) -154,090 x


Formule de calcul du nombre de plaques théoriques

N, le nombre de plateaux théoriques, est un indice utilisé pour déterminer les performances et l'efficacité des colonnes, et est calculé à l'aide de l'équation (1).

1) où tr : temps de rétention, et W : largeur de pic

Cette largeur de pic, W, est basée sur les interceptions de ligne de base de lignes tangentes à un pic gaussien, ce qui équivaut à la largeur de pic à 13,4 % de la hauteur de pic.
Cependant, pour simplifier le calcul et tenir compte des pics non gaussiens, les méthodes de calcul suivantes sont utilisées dans la pratique.

1. Méthode de la ligne tangente

La largeur du pic est la distance entre les points où les lignes tangentes aux points d'inflexion gauche et droit du pic coupent la ligne de base, et est calculée à l'aide de l'équation (1). L'USP (United States Pharmacopeia) utilise cette méthode. Cela se traduit par de petites valeurs N lorsque le chevauchement des pics est important.

Cela pose également un problème si le pic est déformé, de sorte qu'il a plusieurs points d'inflexion.

2. Méthode de demi-hauteur de crête

La largeur est calculée à partir de la largeur à la moitié de la hauteur du pic (W0.5). Comme la largeur peut être calculée facilement à la main, c'est la méthode la plus largement utilisée. C'est la méthode utilisée par la DAB (pharmacopée allemande), la BP (pharmacopée britannique) et l'EP (pharmacopée européenne).

La 15e révision de la pharmacopée japonaise publiée en avril 2006 a modifié le coefficient de 5,55 à 5,54.
(LCsolution permet de sélectionner le coefficient via le réglage [Column Performance], où la méthode de calcul pour 5,54 est "JP" et pour 5,55 est "JP2".
Pour des pics plus larges, la méthode de la hauteur de demi-pic donne des valeurs N plus élevées que les autres méthodes de calcul.

3. Méthode de hauteur de zone

La largeur est calculée à partir des valeurs de surface et de hauteur du pic. Cette méthode fournit des largeurs relativement précises et reproductibles, même pour des pics déformés, mais donne des valeurs N un peu plus grandes lorsque le chevauchement des pics est important.

4. Méthode EMG (Gaussien à modification exponentielle)

Cette méthode introduit des paramètres qui tiennent compte de l'asymétrie des pics et utilise la largeur du pic à 10 % de la hauteur du pic (W0.1). Comme il utilise une largeur proche de la ligne de base, il en résulte des valeurs N plus grandes que les autres méthodes pour les pics larges. De plus, il ne peut pas calculer la largeur à moins que le pic ne soit complètement séparé.

・・・4) un0.1: Largeur de la première moitié du pic à 10 % de hauteur b0.1: Largeur de la seconde moitié du pic à 10 % de hauteur

Comparaison des méthodes de calcul

Etant donné un pic gaussien, chacune de ces méthodes de calcul aboutit à la même valeur N. Cependant, normalement, les pics ont tendance à avoir des traînées, ce qui entraîne des valeurs N différentes pour différentes méthodes de calcul.
Par conséquent, les quatre méthodes de calcul ont été comparées à l'aide de chromatogrammes. Le profil A montre un chromatogramme typique (avec quelques traînées), tandis que le profil B montre un chromatogramme avec des traînées importantes. Le nombre théorique de plaques calculé selon les quatre méthodes est indiqué dans le tableau ci-dessous. Les résultats pour N variaient même pour le chromatogramme A. De plus, les pics avec une distorsion plus importante, comme au pic 1 dans le profil B, peuvent entraîner des valeurs N qui diffèrent de plusieurs fois.
Un facteur clé pour effectuer une analyse quantitative fiable est de savoir si la séparation est possible ou non, de sorte qu'il existe une opinion commune selon laquelle une méthode de calcul qui juge des pics plus larges, comme avec des résidus, plus sévèrement est plus pratique. Cependant, malheureusement, il ne semble pas y avoir de consensus sur les opinions concernant N et W.
Par conséquent, si une certaine méthode est déjà utilisée pour l'évaluation, alors pour réaliser la corrélation, il est probablement préférable de continuer à utiliser la même méthode.

UNE (pic à peu près typique) B (résidus important)
1 2 3 4 1 2 3 4
Méthode de demi-hauteur de crête 15649 20444 20389 22245 5972 7917 - 9957
Méthode de la ligne tangente 14061 18516 20309 21447 5773 7692 5795 9707
Méthode de hauteur de zone 13828 19207 17917 21020 4084 7845 6217 8641
Méthode EMG 10171 15058 14766 17836 1356 - - 4671

Un tiret indique que le calcul n'a pas été possible. Dans la méthode de la demi-hauteur du pic, 5,54 a été utilisé comme coefficient.

Le logiciel de poste de travail LC de Shimadzu est capable de produire des rapports de performances en utilisant l'une des méthodes indiquées ci-dessus - 1. ligne tangente, 2. demi-hauteur de pic (5.54), 2'. demi-hauteur de pic (5,55), 3. hauteur de zone ou EMG. Nous vous recommandons d'enregistrer les résultats de performance de colonne correspondants avec les résultats analytiques !


Estimer la largeur du pic à partir d'un vecteur qui est une superposition d'un nombre inconnu de pics gaussiens identiques avec des hauteurs différentes ?

Si vous avez un vecteur qui est une superposition d'un nombre inconnu de pics/impulsions de forme gaussienne identiques de largeur inconnue (mais tous de la même largeur) et d'amplitudes différentes (avec bruit de Poisson ou gaussien), est-ce que quelqu'un connaîtrait une méthode pour déduire cela largeur?

Par exemple. simulons une superposition de pics gaussiens de largeur 5 dans R :

Si je mesure ce signal (non négatif) dans ce graphe j'aimerais alors pouvoir estimer que la largeur de pic (constante) w des pics gaussiens superposés dans ce cas était de 5 (sans connaître a priori leurs amplitudes/hauteurs ni la vraie nombre de pics ou leur position, mais en supposant que tous sont des Gaussiennes de forme identique mais d'échelle différente). Quelqu'un a-t-il une idée de la façon de procéder de la manière la plus efficace ? Serait-ce possible par ex. de la DFT ou quelque chose? Ou en estimant un train de pointes clairsemé basé sur une matrice/un dictionnaire de covariables avec des pics gaussiens temporellement décalés de différentes largeurs et en vérifiant quelle classe de largeur de pic est sélectionnée le plus souvent sur la base d'une poursuite d'appariement orthogonale ou d'une régression LASSO ? Des pensées? J'ai juste besoin d'une estimation approximative, elle n'a pas besoin d'être précise, mais j'aimerais qu'elle soit rapide.

EDIT : Un algorithme que je connais, mais qui fait plus que ce que je veux en ce sens qu'il estime une seule meilleure forme de pic expliquant le signal est celui de Rooi & Eilers (2011) qui est implémenté dans ce code R :

Pour la norme L0 pénalisée régularisée / sélection du meilleur sous-ensemble, j'ai également trouvé cet article qui, je pense, est un développement ultérieur de la méthode Eilers :

Les problèmes avec cet algorithme sont que (1) l'ajustement n'est pas très stable en termes de propriétés de convergence, (2) il y a deux paramètres de régularisation à régler, (3) que la forme du pic n'est pas contrainte à être gaussienne (pourrait être résolu en ajustant Gaussien sur la forme de pic inférée après chaque itération, mais peut-être y a-t-il un meilleur moyen ??) et (4) l'algo est lent (150 s pour ce petit exemple sur mon ordinateur portable). Donc idéalement, je cherche quelque chose de plus robuste et plus rapide.


Rapport d'aspect de l'image

Adapter les ratios à une variété de supports est souvent un défi pour les concepteurs, en particulier s'ils doivent recadrer et convertir le contenu.

Heureusement, avoir un calculateur de rapport hauteur/largeur rend les choses plus faciles. Si vous travaillez sur une vidéo numérique, il est indispensable de compresser dans un premier temps les fichiers de la vidéo numérique afin de obtenir les dimensions exactes (ou les proportions) de la vidéo.

Cela demande beaucoup de calculs. Et c'est là qu'intervient un calculateur de rapport hauteur/largeur pour aider à rendre ces calculs précis. Pour obtenir les formats exacts de votre vidéo, entrez simplement une dimension et la calculatrice calculera l'autre dimension.


Comment estimez-vous l'erreur sur la hauteur/largeur d'une gaussienne ? - Astronomie

    Intégrale définie (matériel de lycée) :

      Une intégrale définie une &int b f(x) dx est l'intégrale d'une fonction f(x) de points terminaux fixes a et b :

        La méthode du rectangle (également appelée règle du point médian) est la méthode la plus simple en mathématiques utilisée pour calculer une approximation d'une intégrale définie.

          Divisez l'intervalle [ a .. b ] en n morceaux chaque morceau a la même largeur :

      La largeur de chaque morceau des plus petits intervalles est égale à :

      L'aire d'un rectangle est égale à :

      On connaît (déjà) la largeur de chaque rectangle :

          Les différents rectangles ont des hauteurs différentes

            Premier (petit) intervalle : [ a .. ( a + width )] (rappelez-vous que : width = (b &moins a)/n )

          Donc : hauteur du premier rectangle = f(a)

              le deuxième (petit) intervalle est [( a+width ) .. ( a+2width )] (rappelez-vous que : width = (b &moins a)/n )

            Donc : hauteur du premier rectangle = f(a+largeur)

                le troisième (petit) intervalle est [( a+2width ) .. ( a+3width )] (rappelez-vous que : width = (b &moins a)/n )

              Donc : hauteur du premier rectangle = f(a+2width)

                • Hauteur du rectangle 1 = f(a + 0&timewidth)
                • Hauteur du rectangle 2 = f(a + 1&timewidth)
                • Hauteur du rectangle 3 = f(a + 2&timewidth)
                • .
                • Hauteur du rectangle n&moins1 = f(a + (n&moins2)&timewidth)
                • Hauteur du rectangle n = f(a + (n&moins1)&timewidth)

                Remarque : il y a n intervalle (plus petit) au total.

                    Cette figure vous aide à visualiser le calcul :

                    Nous avons vu précédemment un algorithme de calcul de somme cumulée qui ajoute en simple série de nombres :

                      Calculez la somme : 1 + 2 + 3 + . + n

                    Exemple : calculez 1 2 + 2 2 + 3 2 + . + je 2 + . + n 2

                        Le i ème terme de la somme = i 2

                        Nous pouvons utiliser l'algorithme de la somme cumulée pour calculer la somme de l'aire des rectangles

                        Algorithme approximatif (pseudo code) :

                      public class RectangleMethod01 < public static void main(String[] args) < double a, b, w, sum, x_i int i, n a = 0.0 b = 1.0 // 1 &int 2 x 3 dx n = 1000 // Utiliser une valeur plus grande pour une meilleure approximation /* -------------------------------- -------------------- L'algorithme de la règle du rectangle -------------------------- ------------------------ */ w = (ba)/n // Calculer la somme de la largeur = 0.0 // Effacer la somme courante pour ( i = 1 i x_i = a + (i-1)*w sum = sum + ( w * (x_i * x_i * x_i) ) // f(x_i) = (x_i) 3 > System.out.println("Valeur intégrale approximative # 00a000"> Exemple de programme : (Démo au-dessus du code)                                          

                          Faites un clic droit sur le lien et enregistrez dans un répertoire de travail

                        public class RectangleMethod02 < public static void main(String[] args) < double a, b, w, sum, x_i int i, n a = 1.0 b = 2.0 // 1 &int 2 (1/x) dx n = 1000 // Utiliser une valeur plus grande pour une meilleure approximation /* ----------------------------- ---------------------- L'algorithme de la règle du rectangle ------------------------ --------------------------- */ w = (ba)/n // Calculer la somme de la largeur = 0.0 // Effacer la somme courante pour ( i = 1 i x_i = a + (i-1)*w sum = sum + ( w * (1/x_i) ) // f(x_i) = 1/x_i > System.out.println("Valeur intégrale approximative # 00a000"> Exemple de programme : (Démo au-dessus du code)                                          

                            Faites un clic droit sur le lien et enregistrez dans un répertoire de travail

                            Différence dans les approximations lors de l'utilisation d'un nombre différent de rectangles :

                              L'utilisation de plus de rectangles fera que l'algorithme ajoutera plus de nombres

                                Souvent , dans les algorithmes informatiques , un résultat plus précis peut être obtenu par une exécution plus longue du même algorithme

                              Vous pouvez expérimenter le phénomène de compromis en utilisant n = 1000000 dans l'algorithme ci-dessus.


                              Comment calculer le nombre de plateaux théoriques en chromatographie en phase gazeuse ?

                              Il existe plusieurs formules, mais la plus courante est basée sur l'hypothèse que les pics sont des courbes de Gauss.

                              Explication:

                              Le nombre de plateaux théoriques #n# , est le nombre de distillations discrètes qu'il faudrait effectuer pour obtenir une séparation équivalente.

                              Les colonnes de chromatographie en phase gazeuse ont normalement des plateaux théoriques #10^3# à #10^6#.

                              Le nombre de plateaux théoriques est lié au temps de rétention, #t_r# , et à la largeur du pic contenant le composé.

                              Si les pics sont raisonnablement symétriques, on peut supposer qu'ils ont une forme gaussienne. Puis

                              où #w_(1/2)# est la largeur du pic à mi-hauteur.

                              Vous trouvez la largeur du pic à mi-hauteur en traçant une ligne verticalement du maximum du pic à la ligne de base, en mesurant à mi-hauteur du pic, en traçant une ligne horizontale et en mesurant la longueur de la ligne horizontale.

                              Vous mesurez le temps de rétention (désigné avove comme #V_e# pour le volume d'élution) au point où la ligne verticale tracée par le maximum coupe la ligne de base.

                              #t_r# et #w_(1/2)# doivent être mesurés dans les mêmes unités.

                              Un chromatogramme d'une certaine colonne a un pic avec un #w_(1/2)# de 12 mm et un #t_r# de 650 mm tel que mesuré sur le graphique. Quel est le nombre de plateaux théoriques ?

                              #n = 5,54(t_r/w_(1/2))^2 = 5,54((650 annuler("mm"))/(12 annuler("mm")))^2 = "16 250 plateaux théoriques"#