ďťż
identyfikowanie danych
Lucyna Michalec - Pon Lip 06, 2009 2:30 pm W pliku rex_wycena w arkuszu "dane", na czerwono zaznaczone są dane odstające. Czasem pokrywają się one z błędami % dla przypadków w ark. "model" i z odległością Cooka, a czasem nie. Dlaczego tak jest i czy wogóle mam zwracać uwagę na te czerwone napisy? Trochę myli identyfikowanie nieruchomości w sytuacji kiedy wybieram ją jako odstającą do usunięcia, ponieważ nr nieruchomości na wykresach nie odpowiada nr nieruchomości w ark. "dane", o ile wcześniej którąś nieruchomość już usunęłam z analizy. W związku z tym przed usunięciem kolejnej nieruchomości trzeba liczyć od początku, którą w kolejności mam usunąć. Przy małej ilości danych jest to do zniesienia, ale jeśli będzie ich kilkaset? Brakuje mi kolumny w ark. "dane", w której mogłabym wpisać np. własny kod nieruchomości albo adres, żebym łatwiej i szybciej mogła ją zidentyfikować. Tomasz Kotrasiński - Wto Lip 07, 2009 7:09 am OK. Myślę, że tę funkcjonalność, tzn. miejsce na opis identyfikacyjny nieruchomości, będzie stosunkowo łatwo wprowadzić. Jeśli idzie o numerację w wykresach dotyczących błędu % o odległości Cooka, też powinno się dać radę poprzez nazwanie słupków przypadkami albo numerami. Te funkcjonalności z całą pewnością pojawią się w najbliższej rewizji wersji rex_wycena. Lucyna Michalec - Wto Lip 07, 2009 6:00 pm Jeszcze proszę o odpowiedź na to: W pliku rex_wycena w arkuszu "dane", na czerwono zaznaczone są dane odstające. Czasem pokrywają się one z błędami % dla przypadków w ark. "model" i z odległością Cooka, a czasem nie. Dlaczego tak jest i czy wogóle mam zwracać uwagę na te czerwone napisy? Tomasz Kotrasiński - Wto Lip 07, 2009 7:30 pm Kryterium odstawania w tej wersji arkusza związane jest z APE (absolute percentage error - bezwzględny błąd procentowy). I podpowiedź "odstająca" związana jest z przyjętym kryterium APE i zawsze się pokrywa. Choć jest to jedno z możliwych kryteriów (najprostsze) i nie zawsze pokrywa się dokładnie z innymi kryteriami (reszt standaryzowane i odległość Cook'a). Natomiast, jak pisałem, numeracja na grafie przedstawiającym APE (i inne kryteria) nie pokrywa się z numeracją pierwotną przypadków, gdy usuniemy pewną liczbę danych. Jeżeli mamy początkowo pewną liczbę danych oznaczonych od 1 do 20, to po usunięciu jednej danej na wykresie przedstawiającym APE odległość Cook'a lub reszty standaryzowane przypadki są ponumerowane od 1 do 19, tzn. są kolejnymi numerami przypadków, które pozostały a nie pierwotnymi numerami przypadków. Na szczęście to można dość łatwo poprawić, tak, żeby na ww. wykresach pojawiały się "pierwotne numery", co można zobaczyć na tym grafie: Jak widać na tym wykresie, po usunięciu przypadku nr 3, dla 20 danych mamy numerację pierwotną od 1 do 20 a nie od 1 do 19, z pominięciem numeru danej pominiętej. Numery te stają się więc na tych wykresach numerami przypadków. Czekamy na więcej propozycji aby móc wypuścić wersję poprawioną, ale że Lucy lubimy szczególnie w dziale z plikami dajemy wersję 1.0.2., w której numeracja z grafów APE itp. zgodna jest z pierwotną numeracją w arkuszu "dane". Lucyna Michalec - Śro Lip 08, 2009 10:21 am Dziękuję Tomku za wyjaśnienia, a szczególnie za poprawioną wersję pliku. |