Хеширование данных для Яндекс
Кейс работы с AI ChatGPT
Хеширование данных для Яндекс
кейс работы с AI
Задача: хешировать данные о покупателях и передать в Яндекс для мэтчинга. Данные о покупателях в моём случае в двух столбцах таблицы XLSX: номер телефона и дата покупки. В Яндекс нужно передать TXT файл с хешированными данными по алгоритму MD5.
Решение: скрипт на Python от ChatGPT. Скачать скрипт с Google Drive вместе с примером исходных данных.
import pandas as pd
import hashlib
# Считайте данные из Excel
df = pd.read_excel('D:\\Проекты\\проект\\хэшер\\Данные о покупателях.xlsx')
# Хешируйте данные
def hash_data(data):
hashed_data = []
for index, row in df.iterrows():
hashed_row = []
for value in row:
hashed_value = hashlib.md5(str(value).encode()).hexdigest()
hashed_row.append(hashed_value)
hashed_data.append(hashed_row)
return hashed_data
hashed_data = hash_data(df)
# Формируйте хеш-строку
def form_hash_string(hashed_data):
hash_string = ''
for row in hashed_data:
for value in row:
hash_string += value + ','
hash_string = hash_string[:-1] + '\n'
return hash_string
hash_string = form_hash_string(hashed_data)
# Сохраните хеш-строку в файл
with open('D:\\Проекты\\проект\\хэшер\\Данные о покупателях MD5.txt', 'w') as f:
f.write(hash_string)
Комментарии: В скрипте hash.py указываете путь к источнику данных таблицы XLSX и путь по которому нужно сохранить данные в хешированном виде в файле с расширением TXT. При необходимости можно сменить алгоритм хеширования с MD5 на SHA-256.
Какие данные доступны после мэтчинга
Получившийся файл передал менеджеру Яндекса для мэтчинга данных рекламной кампании в Яндекс Бизнес. Через несколько дней получил от Яндекса таблицу с данными:
- Срок — Период, за который делаем мэтчинг хешей.
- Сумма за период (до НДС) — сколько было потрачено на рекламу за период.
- Кол‑во записей — сколько хешей было в файле клиента.
- Кол‑во совпадений — сколько хешей нашлось в системе.
- Сумма совпадений — сумма покупок по тем пользователям, которые совпали по файлу клиента.
- Ср. чек — средний чек клиента за период работы рекламы.
- ДРР — показатель, отражающий отношение рекламных расходов к доходам от этой рекламы.
- % авторизованных от общего числа — процент пользователей, которые пользуются версиями Карт будучи авторизованными.
- Кол‑во авторизованных от общего числа — показываем, сколько авторизованных пользователей было из тех, которые выслал клиент.
- % авторизованных с записью — показываем процент авторизованных пользователей, которые совершили покупку.
- Кол‑во авторизованных с записью — показываем, сколько авторизованных пользователей совершили покупку.
ДРР или данных по среднему чеку может и не быть, всё зависит от того какими данными с вами поделился клиент и что вы передали в Яндекс.
Без привлечения ресурсов разработчика, без знаний Phyton и с помощью ChatGPT решил небольшую задачу. Продолжаю перестраивать работу в интернет-маркетинге, чтобы осознать возможности AI и больше использовать искусственный интеллект в разных задачах. Решение от DeepSeek пока не изучал.
Может пригодиться:
- Требования к файлам для Яндекс Аудиторий.
- Про Advanced Matching для рекламодателей Яндекса. Поможет повысить эффективность рекламы.