Сазнајте Компатибилност Од Стране Зодијачког Знака
Како новинари могу да користе Геоцоммонс за креирање интерактивних мапа
Остало
Пре неколико месеци, Јохн Кеефе је написао Поинтер.орг Хов То о коришћењу схапе фајлова. Моћ схапефиле-а, написао је, је способност да се позива на регионе уместо на тачке.
Али шта ако ваши подаци имају тачке (на пример, адресе), а ви желите да мапирате регионе? Рецимо, на пример, имате адресе кршења животне средине и желите да покажете који конгресни округи имају највише кршења. Морате пронаћи начин да повежете те тачке у облике. У овом водичу ћу објаснити како то учинити.
Хајде да употребимо пример из организације за коју радим, Сунлигхт Фоундатион. Имамо сајт под називом Транспарентност података , где корисници могу да преузимају податке, од којих неки укључују адресе. Један такав скуп података су подаци о кршењима ЕПА. Идите на податке о транспарентности, кликните на картицу „ЕПА“, а затим потражите кршења између 1. јула 2011. и 31. децембра 2011. Подаци о транспарентности ће вратити око 1300 записа. Кликните на огромно дугме „Преузми податке“ да бисте сачували записе на свом рачунару.
Када преузмемо те податке, отворићемо их у табели. Видећете да једна од колона садржи адресу кршења. (Имајте на уму да неке од ћелија у овој колони укључују више адреса, док друге немају уопште адресе. За наше сврхе, елиминисаћемо све записе са више адреса или оне без икаквих адреса. Можете се позвати на ову ранију причу, „Како новинари могу да користе Екцел за организовање података за приче“ ако вам је потребна помоћ у томе.)
Такође треба да раздвојимо адресу на саставне делове. Направићу нове колоне за град, државу и ЗИП.
(Можете се обратити једном од мојих ранијих упутства – „Како новинари могу да користе регуларне изразе за упаривање низова текста“ за помоћ у вези са овим. Савет, мој проналазак/замена је био да тражим:
|_+_|и замени са:
|_+_|То ће оставити неке грешке (као што су бројеви апартмана у пољу града), које ћемо исправити тражењем:
|_+_|и замени са:
|_+_|Када су подаци очишћени, вратићемо их у нашу табелу. Затим ћемо извести ту табелу као .цсв или текстуалну датотеку „вредности раздвојене зарезима“ која вам даје фајл који изгледа овако .)
Сада, да бисмо објединили ове адресе са конгресним окрузима, користићемо један од мојих омиљених алата: ГеоЦоммонс . Започећемо овај процес извозом горње табеле као ЦСВ или текстуалне датотеке „вредности раздвојене зарезима“. Овде сам поставио пример датотеке . Затим ћемо тај ЦСВ отпремити директно у ГеоЦоммонс.
Након отпремања на ГеоЦоммонс, пратићемо упутства све док услуга од нас не затражи да „помогнемо у геолоцирању“ података. Дате су нам две опције. Прво, можемо повезати или спојити податке са граничним скупом података. Ако бисмо изабрали ову опцију, били би нам потребни подаци о границама у табели. Такви подаци могу укључивати називе округа или ФИПС кодове, конгресне кодове округа, пописне тракте и слично. Немамо та поља у нашим подацима.
Друга опција, „геокодирање на основу адресе или назива места“, узима информације о локацији, као што је адреса улице, и претвара их у географску дужину и ширину. Ово је опција коју желимо да изаберемо.
У зависности од заглавља у вашој датотеци, ГеоЦоммонс може аутоматски препознати нека од поља локације. У супротном, мораћемо да помогнемо ГеоЦоммонс-у да одреди која поља сачињавају адресу. Да бисмо то урадили, померићемо се надоле до „адреса локације“ и изабрати „измени“. Тамо ћемо изабрати „уличну адресу“. Урадићемо исто за град, државу и поштански број. Затим кликните на „Настави“. (Напомена, ГеоЦоммонс може геокодирати само до 5.000 адреса по датотеци.) Такође можете прилагодити друге типове података поља ако желите или требате.
Сервису ће требати неко време да декодира адресе и претвори их у тачке ширине и дужине. На крају тог процеса, ГеоЦоммонс ће нас обавестити колико добро је успео да геолоцира адресе. У мом тесту, геокодирање је трајало око 10 минута. (Ако не желите да чекате да се ваша датотека геокодира, слободно користите копију мојих података, која је доступна овде .) Наравно, можете користити и друге услуге да геокодирате податке у географску ширину и дужину, а затим отпремите ЦСВ који садржи та поља — поред свих осталих — у ГеоЦоммонс.
Затим ћемо искористити једну од најбољих карактеристика ГеоЦоммонс-а: способност анализе података. Ако одемо до нашег ново геокодираног скупа података, можемо приступити овим функцијама кликом на дугме „анализирај“ у горњем десном углу странице.
Ово доноси мноштво опција. Требало би да проведете неко време играјући се са овим алатима, али за овај водич ћемо изабрати други, „Агрегација“. У резултујућем дијалошком оквиру треба да изаберемо гранични скуп. Појавиће се прозор и тражићемо „111. конгресни округ“. Тамо ћемо изабрати округе које сам отпремио. Ови округи су у форми схапе фајлова, што је векторски метод за описивање области.
Поништио сам избор „Задржи празне границе“, јер не желим да приказујем округе који немају кршења правила.
ГеоЦоммонс ће сада извршити своју анализу, која је у мом случају трајала око 20 минута. Добијена датотека се налази овде .
Иако можете мапирати резултујући скуп података у оквиру ГеоЦоммонс-а, сматрам да су карте услуге превише ограничавајуће. На пример, немате потпуну контролу над начином на који су форматиране информације у описима алата за мапу.
Из тог разлога волим да извозим мапу из ГеоЦоммонс-а користећи функцију „Преузми као КМЛ“. КМЛ датотека коју ГеоЦоммонс извози садржи све податке, као и информације о границама. Са овом датотеком могу да се окренем Гоогле Фусион Таблес-у, увезем КМЛ и имам потпуну контролу над дизајном, сенчењем, прозором са информацијама и још много тога. Јохн Кеефе је то већ покрио у свом уводу у схапе фајлове, тако да нећу покривати исто тло.
Иако обично не користим Геоцоммонс за готову мапу, то је непроцењив алат за креирање информативних и занимљивих мапа, посебно када се ради о границама или областима.
Забавите се истражујући и поделите своје искуство са ГеоЦоммонс-ом и мапирањем у одељку за коментаре. Ако имате друге теме које бисте желели да покрије/обратите у овој серији, обавестите нас.
Ова прича је део Поинтера Хакови/Хакери серија са Како да који се фокусирају на оно што новинари могу научити из нових трендова у технологији и нових технолошких алата.