Есть JSON строка. В ней есть дубляжи в некоторых полях. Нужно при помощи библиотеки Python Pandas агрегировать данные. Вместо кучи слов лучше показать, что я хочу получить в итоге.
Вот код и данные
paste.ofcode.org/6pucGEuf... Надо агрегировать данные, так, чтобы три различающихся поля: 's_inn','s_kpp','s_name'
Были объединены в одно и вместо двух последних объектов я получил один вот такой:
{
"t_registration_number": "31805988205",
"t_customer_inn": "2801010011",
"t_customer_kpp": "280101001",
"t_customer_ogrn": "1022800512624",
"t_customer_short_name": "ГАУЗ АО ДЕТСКАЯ ГКБ",
"t_placer_inn": "2801010011",
"t_placer_kpp": "280101001",
"t_placer_ogrn": "1022800512624",
"t_placer_short_name": "ГАУЗ АО ДЕТСКАЯ ГКБ",
"r_rus_name": "Амурская область",
"t_publication_date": "2018-01-09",
"s_inn": "2723071046, 7018040688",
"s_kpp": "272301001, 701701001",
"s_name": "ООО МЕДИАС, ООО СКАН М",
"s_lotguid": "2fd7440e-e0a1-4fa0-ae7b-b901b1e378d5",
"n_prc_diff_nmc": "2",
"nlots_nmck": 34384
}
т.е. данные были добавлены через запятую.
ИЛИ (в идеале) JSON объект бы выглядел так:
{
"t_registration_number": "31805988205",
"t_customer_inn": "2801010011",
"t_customer_kpp": "280101001",
"t_customer_ogrn": "1022800512624",
"t_customer_short_name": "ГАУЗ АО ДЕТСКАЯ ГКБ",
"t_placer_inn": "2801010011",
"t_placer_kpp": "280101001",
"t_placer_ogrn": "1022800512624",
"t_placer_short_name": "ГАУЗ АО ДЕТСКАЯ ГКБ",
"r_rus_name": "Амурская область",
"t_publication_date": "2018-01-09",
"aggregated": [
{
"s_inn": "2723071046",
"s_kpp": "272301001",
"s_name": "ООО МЕДИАС",
},
{
"s_inn": "7018040688",
"s_kpp": "701701001",
"s_name": "ООО СКАН М",
}
],
"s_lotguid": "2fd7440e-e0a1-4fa0-ae7b-b901b1e378d5",
"n_prc_diff_nmc": "2",
"nlots_nmck": 34384
}
Все! Больше ничего не нужно!
В комментах напишите плиз свой Телеграмм.
Пожалуйста НЕ студии!!!