ďťż
identyfikowanie danych




Lucyna Michalec - Pon Lip 06, 2009 2:30 pm
W pliku rex_wycena w arkuszu "dane", na czerwono zaznaczone są dane odstające. Czasem pokrywają się one z błędami % dla przypadków w ark. "model" i z odległością Cooka, a czasem nie. Dlaczego tak jest i czy wogóle mam zwracać uwagę na te czerwone napisy?
Trochę myli identyfikowanie nieruchomości w sytuacji kiedy wybieram ją jako odstającą do usunięcia, ponieważ nr nieruchomości na wykresach nie odpowiada nr nieruchomości w ark. "dane", o ile wcześniej którąś nieruchomość już usunęłam z analizy. W związku z tym przed usunięciem kolejnej nieruchomości trzeba liczyć od początku, którą w kolejności mam usunąć. Przy małej ilości danych jest to do zniesienia, ale jeśli będzie ich kilkaset?
Brakuje mi kolumny w ark. "dane", w której mogłabym wpisać np. własny kod nieruchomości albo adres, żebym łatwiej i szybciej mogła ją zidentyfikować.




Tomasz Kotrasiński - Wto Lip 07, 2009 7:09 am
OK. Myślę, że tę funkcjonalność, tzn. miejsce na opis identyfikacyjny nieruchomości, będzie stosunkowo łatwo wprowadzić.
Jeśli idzie o numerację w wykresach dotyczących błędu % o odległości Cooka, też powinno się dać radę poprzez nazwanie słupków przypadkami albo numerami.
Te funkcjonalności z całą pewnością pojawią się w najbliższej rewizji wersji rex_wycena.



Lucyna Michalec - Wto Lip 07, 2009 6:00 pm
Jeszcze proszę o odpowiedź na to:

W pliku rex_wycena w arkuszu "dane", na czerwono zaznaczone są dane odstające. Czasem pokrywają się one z błędami % dla przypadków w ark. "model" i z odległością Cooka, a czasem nie. Dlaczego tak jest i czy wogóle mam zwracać uwagę na te czerwone napisy?



Tomasz Kotrasiński - Wto Lip 07, 2009 7:30 pm
Kryterium odstawania w tej wersji arkusza związane jest z APE (absolute percentage error - bezwzględny błąd procentowy).
I podpowiedź "odstająca" związana jest z przyjętym kryterium APE i zawsze się pokrywa.
Choć jest to jedno z możliwych kryteriów (najprostsze) i nie zawsze pokrywa się dokładnie z innymi kryteriami (reszt standaryzowane i odległość Cook'a).
Natomiast, jak pisałem, numeracja na grafie przedstawiającym APE (i inne kryteria) nie pokrywa się z numeracją pierwotną przypadków, gdy usuniemy pewną liczbę danych. Jeżeli mamy początkowo pewną liczbę danych oznaczonych od 1 do 20, to po usunięciu jednej danej na wykresie przedstawiającym APE odległość Cook'a lub reszty standaryzowane przypadki są ponumerowane od 1 do 19, tzn. są kolejnymi numerami przypadków, które pozostały a nie pierwotnymi numerami przypadków.
Na szczęście to można dość łatwo poprawić, tak, żeby na ww. wykresach pojawiały się "pierwotne numery", co można zobaczyć na tym grafie:


Jak widać na tym wykresie, po usunięciu przypadku nr 3, dla 20 danych mamy numerację pierwotną od 1 do 20 a nie od 1 do 19, z pominięciem numeru danej pominiętej.
Numery te stają się więc na tych wykresach numerami przypadków.

Czekamy na więcej propozycji aby móc wypuścić wersję poprawioną, ale że Lucy lubimy szczególnie w dziale z plikami dajemy wersję 1.0.2., w której numeracja z grafów APE itp. zgodna jest z pierwotną numeracją w arkuszu "dane".




Lucyna Michalec - Śro Lip 08, 2009 10:21 am
Dziękuję Tomku za wyjaśnienia, a szczególnie za poprawioną wersję pliku.
Powered by WordPress, ©