Titelangaben
Brandl, Matthias:
Higher Order Asymptotics for the MSE of Robust M-Estimators of Location on Shrinking Total Variation Neighborhoods.
Bayreuth
,
2008
(
Dissertation,
2008
, Universität Bayreuth, Fakultät für Mathematik, Physik und Informatik)
Abstract
In the setup of shrinking neighbourhoods in sample size n about an ideal (“smooth”) central model, Rieder (1994) determines the optimal asymptotic linear estimator w.r.t. the asymptotic MSE evaluated uniformly on these neighbourhoods. We answer the question to which degree the asymptotic optimality carries over to finite sample size in the context of total variation neighbourhoods. In contrast to usual higher order asymptotics, instead of giving approximations to distribution functions (or densities), we expand the risk directly by application of Edgeworth and Taylor expansions. In the context of determining the exact finite sample risk for sample size n>2 M. Kohl showed in Kohl (2005) that the speed of convergence towards the asymptotic risk is faster by an order in case of total variation compared to convex contamination neighbourhoods. M. Kohl conjectured that this is caused by the higher symmetry of total variation neighbourhoods. Looking at the MSE in the asymptotic optimal setup we get the same results as M. Kohl for finite sample risk. Furthermore we can show by direct expansion of the MSE that for a higher speed of convergence symmetry of the ideal distribution F is essential. We confirm our result by a cross-check in the ideal model and illustrate our theoretical investigations for F = N(0;1). We also deal with the question of an actual realization of a least favourable deviation from the ideal model in a finite context. We settle on the symmetric case and monotone odd influence curves of Hampel-type form, and show that for a certain kind of manipulation mechanism we gain our theoretical results up to the desired order. It shows up that we only get access to the results in the finite context if we require the finite sample to attain the minimum and maximum of the given influence curve with a certain probability already. Depending on this probability we derive a lower bound on the sample length n. We substantiate the sufficiently exact algorithm by determining the amount K of observations to be manipulated as well as the bound c on the observations for having maximum influence on the MSE according to the value of the influence curve. We give a restrictive condition on the distribution of K that lets the probability of the (K:n)-quantile exceeding a now concrete bound c be exponentially negligible. The bound c is explicitly calculated for F = N(0;1) and suitable four-point distributions for K are given that satisfy all the previous claimed conditions. Thus we gain an algorithm generating observations from a least favourable distribution out of a finite total variation neighbourhood w.r.t. an asymptotically optimal risk.
Abstract in weiterer Sprache
Für in der Stichprobengröße n schrumpfende Umgebungen eines idealen („glatten“) Zentralmodells, liefert Rieder (1994) die optimalen asymptotisch linearen Schätzer in Bezug auf den gleichmäßig auf diesen Umgebungen ausgewerteten asymptotischen MSE. Wir beantworten die Frage, inwieweit sich die asymptotische Optimalität für Totalvariationsumgebungen auf finite Stichproben übertragen lässt. Im Gegensatz zu bisherigen Ansätzen hinsichtlich Höherer-Ordnungs-Asymptotik entwickeln wir das Risiko direkt mittels Edgeworth- und Taylorentwicklungen, anstatt Approximationen von Verteilungsfunktionen (oder Dichten) anzugeben. Bei der Bestimmung eines exakten Risikos für finite Stichproben der Länge n>2 zeigte M. Kohl in Kohl (2005) außerdem, dass die Konvergenzgeschwindigkeit gegen das asymptotische Risiko für Totalvariationsumgebungen eine Ordnung höher ist als für Konvex-Kontaminationsumgebungen. M. Kohl vermutete, dass dies durch die höhere Symmetrie der Totalvariationsumgebung verursacht wird. Bei der Betrachtung des MSE im asymptotisch optimalen Kontext erhalten wir dieselben Resultate wie M. Kohl für das Risiko bzgl. finiter Stichproben. Außerdem können wir durch direkte Entwicklung des Risikos zeigen, dass die Ursache für eine höhere Konvergenzgeschwindigkeit die Symmetrie der idealen Verteilung F ist. Unser Resultat wird durch einen Cross-Check mit dem idealen Modell untermauert und wir illustrieren unsere theoretischen Ergebnisse für F=N(0;1). Weiterhin beschäftigen wir uns mit einer tatsächlichen Realisierung einer ungünstigsten Abweichung vom idealen Modell in einem finiten Kontext. Dabei spezialisieren wir uns auf den symmetrischen Fall und monotone, ungerade Influenzkurven vom Hampel-Typ, und zeigen, dass wir für einen bestimmten Manipulationsmechanismus unsere theoretischen Resultate mit hinreichender Genauigkeit erhalten. Es zeigt sich außerdem, dass wir die Resultate im finiten Kontext nur dann erhalten, wenn wir von der finiten Stichprobe verlangen, dass sie Minimum und Maximum der gegebenen Influenzkurve mit einer gewissen a-priori-Wahrscheinlichkeit auch wirklich annimmt. In Abhängigkeit von dieser Wahrscheinlichkeit leiten wir eine untere Schranke an die Stichprobenlänge n ab. Den hinreichend exakten Algorithmus konkretisieren wir, indem wir sowohl die Anzahl K der zu manipulierenden Beobachtungen wie auch eine Schranke c an die Beobachtungswerte bestimmen, so dass diese maximalen Einfluss hinsichtlich der Influenzkurve auf den MSE haben. Weiterhin geben wir eine restriktive Bedingung an die Verteilung von K an, die die Wahrscheinlichkeit, dass das (K:n)-Quantil die Schranke c überschreitet, exponentiell vernachlässigbar werden lässt. Die Schranke c wird für den Fall F=N(0;1) explizit berechnet und passende Vier-Punkt-Verteilungen für K, die allen bis dahin abgeleiteten Bedingungen genügen, werden angegeben. Somit erhalten wir einen Algorithmus, der Beobachtungen einer, hinsichtlich eines asymptotisch optimalen Risikos, ungünstigsten Verteilung aus einer finiten Totalvariationsumgebung erzeugt.
Weitere Angaben
Publikationsform: | Dissertation |
---|---|
Zusätzliche Informationen: | msc: 62E15; msc: 62E20; msc: 62F12; msc: 62F35; msc: 62G30 |
Keywords: | Robuste Statistik; Lokation <Statistik>; Asymptotik; Nachbarschaft <Mathematik>; Edgeworth-Reihe; Höhere-Ordnungs-Asymptotik; Lokation; Totalvariation; Infinitesimale schrumpfende Umgebungen; Robustheit; Higher order asymptotics; Location; Total variation; Infinitesimal shrinking neighborhoods; Robustness |
Institutionen der Universität: | Fakultäten > Fakultät für Mathematik, Physik und Informatik > Mathematisches Institut Fakultäten Fakultäten > Fakultät für Mathematik, Physik und Informatik |
Titel an der UBT entstanden: | Ja |
Themengebiete aus DDC: | 500 Naturwissenschaften und Mathematik > 510 Mathematik |
Eingestellt am: | 01 Mai 2015 10:57 |
Letzte Änderung: | 01 Mai 2015 10:57 |
URI: | https://eref.uni-bayreuth.de/id/eprint/12060 |