O classificador k-NN: o antigo e o novo

Mini-curso MC5, escola de verão 2012 do DM-UFSC

Vladimir Pestov

(professor tutular, Université d'Ottawa, Canadá; currículo Lattes)

Duração do curso: 4 horas (2 x 2)
Língua da instrução: Português
Resumo do curso: O classificador dos k-vizinhos mais próximos, ou classificador k-NN, é um dos métodos mais populares e importantes da classificação automática dos dados. A fundação teórica do método é assegurada pelo teorema de Stone (1977) sobre a consistência universal do classificador no espaço euclideano Rd. Nós daremos uma prova do resultado e discutiremos uns desenvolvimentos recentes concernando o desempenho do classificador nos espaços duma grande dimenção d, assim que nos espaços duma dimenção infinita (a classificação funcional).
Bibliografia:
  1. C. Stone, Consistent nonparametric regression, Annals of Statistics 5 (1977), 595-645.
  2. Luc Devroye, László Györfi and Gábor Lugosi, A Probabilistic Theory of Pattern Recognition, Springer-Verlag, New York, 1996. ISBN 0-387-94618-7.
  3. F. Cérou, A. Guyader, Nearest neighbor classification in infinite dimension, ESAIM Probab. Stat. 10 (2006), 340-355.
  4. G. Biau, F. Bunea, M.H. Wegkamp, Functional classification in Hilbert spaces, IEEE Transactions on Information Theory, 51 (2005), 2163-2172.
  5. A. Zakai and Y. Ritov, Consistency and localizability, J. Mach. Learn. Res. 10 (2009), 827-856.
  6. V. Pestov, Is the k-NN classifier in high dimensions affected by the curse of dimensionality?, Dagstuhl preprint DPA-11341, October 2011 [arXiv]