Building with the Claude API — конспект курса Anthropic
Прошла курс Anthropic Academy по Claude API. Модели, tool use, RAG, MCP, агенты — практический разбор для разработчиков и маркетологов.
Когда я прошла Claude 101, мне хотелось глубже. Как именно работает API? Почему разговор с Claude не сохраняется автоматически? Как дать модели инструменты для работы с внешними системами? Ответы на эти вопросы я нашла в курсе Building with the Claude API от Anthropic Academy.
Этот курс для тех, кто хочет не просто пользоваться Claude в веб-интерфейсе, а встраивать его в свои продукты и автоматизации. Даже если вы не программист, понимание этих принципов изменит то, как вы думаете об AI-системах.
Курс: Building with the Claude API Платформа: Anthropic Academy (anthropic.skilljar.com) Длительность: ~2 часа Язык: English Бесплатно, с сертификатом Это мой авторский конспект, не официальный перевод.
Какую модель Claude выбрать: Opus, Sonnet или Haiku?
Anthropic выпускает модели в трёх размерах, и выбор между ними определяет баланс качества, скорости и стоимости. Это не просто «большая модель лучше». Каждый размер оптимизирован под свои задачи.
Claude Opus 4.5 — флагман. Самая умная модель, лучшее качество рассуждений, понимание нюансов, сложные аналитические задачи. Но и самая дорогая. Используйте для задач, где качество критично: стратегический анализ, сложные исследования, написание важных документов.
Claude Sonnet 4 — рабочая лошадка. Баланс между качеством и скоростью. Идеальна для большинства продакшн-задач: обработка клиентских запросов, генерация контента, анализ данных. Я использую Sonnet для 80% своих автоматизаций.
Claude Haiku 3.5 — самая быстрая и дешёвая. Подходит для простых задач: классификация, извлечение данных, первичная обработка. Когда нужно обработать 10 000 сообщений за минуту, Haiku справится, а Opus разорит бюджет.
| Модель | Сильные стороны | Когда использовать | Стоимость (относительно) |
|---|---|---|---|
| Opus 4.5 | Глубокий анализ, нюансы, сложные рассуждения | Стратегия, исследования, критически важный контент | $$$ |
| Sonnet 4 | Баланс качества и скорости | Продакшн-задачи, ежедневная работа | $$ |
| Haiku 3.5 | Скорость, объём, простота | Классификация, маршрутизация, массовая обработка | $ |
Практический пример из моей работы: когда я настраивала систему автоответов для стоматологии, использовала связку. Haiku классифицирует входящее сообщение (жалоба? вопрос о цене? запись?). Sonnet генерирует ответ. Opus подключается только для сложных случаев, требующих деликатного разбора. Экономия бюджета примерно в 5 раз по сравнению с использованием Opus для всего.
Почему Claude API stateless и что это значит для разработчика?
Главное открытие курса для меня: API не помнит предыдущие сообщения. Каждый запрос для Claude как новый разговор с незнакомцем. Веб-интерфейс claude.ai создаёт иллюзию памяти, но под капотом всё работает иначе.
Когда вы общаетесь в чате, интерфейс сохраняет историю сообщений и отправляет её целиком с каждым новым запросом. Если в разговоре 50 сообщений, все 50 отправляются на сервер каждый раз. Это называется multi-turn conversation, многоходовой разговор.
Почему это важно понимать? Потому что контекстное окно ограничено. Оно измеряется в токенах (примерно одно слово). У Claude окно до 200 000 токенов. Звучит много, но при активной переписке заполняется быстро.
Anthropic предлагает несколько стратегий управления контекстом:
- Summarization (суммаризация) — периодически просить модель сжать историю разговора в краткое резюме
- Sliding window (скользящее окно) — хранить только последние N сообщений
- RAG (retrieval) — хранить историю во внешней базе и извлекать релевантные фрагменты
Я использую комбинацию: для долгих проектов храню контекст в отдельных файлах (память агента), а в промпт загружаю только то, что нужно для текущей задачи. Это экономит токены и улучшает качество ответов, потому что модель не отвлекается на нерелевантную информацию.
Tool Use: как дать Claude инструменты для работы с внешним миром
Здесь начинается самое интересное. Tool use (использование инструментов) позволяет Claude взаимодействовать с внешними системами: API, базами данных, файлами, сервисами.
Как это работает? Вы описываете инструмент в формате JSON Schema: название, описание, параметры. Claude анализирует запрос пользователя и решает, какой инструмент вызвать и с какими параметрами. Вы получаете этот вызов, выполняете действие в реальном мире и возвращаете результат Claude. Модель формирует финальный ответ на основе полученных данных.
Пользователь: "Какая погода в Москве?"
↓
Claude: "Мне нужно вызвать инструмент get_weather с параметром city='Москва'"
↓
Ваш код: вызывает API погоды, получает данные
↓
Claude: "Сейчас в Москве +18°C, облачно, без осадков"
Anthropic выделяет три типа инструментов:
- Read-only — получение информации (погода, курсы валют, поиск в базе)
- Write — изменение данных (создание записи, отправка сообщения)
- Complex — многошаговые операции (бронирование с подтверждением)
Ключевой принцип: Claude всегда должен объяснить, зачем вызывает инструмент. Это не технический каприз, а принцип безопасности. Модель не должна молча выполнять действия. Прозрачность защищает от ошибок и злоупотреблений.
Мой пример из практики: у меня настроен инструмент для работы с Google Sheets. Claude может читать контент-план, добавлять новые идеи, обновлять статусы. Но каждое действие логируется, и я вижу, что именно было изменено. Это важно, когда работаешь с клиентскими данными.
RAG: как научить Claude работать с вашими документами
RAG (Retrieval Augmented Generation) решает главную проблему языковых моделей: они знают только то, на чём обучались. Ваши внутренние документы, базу знаний, прайс-лист, отзывы клиентов модель не видела. RAG позволяет подключить эти данные.
Курс объясняет механику на понятном примере. Представьте юриста, который готовится к делу. Он не помнит все законы наизусть. Вместо этого он ищет релевантные статьи в правовой базе, выписывает нужные цитаты и на их основе строит аргументацию. RAG работает так же.
Три этапа RAG:
- Indexing (индексация) — разбиваете документы на куски, создаёте векторные представления (embeddings)
- Retrieval (поиск) — находите куски, семантически близкие к запросу пользователя
- Generation (генерация) — передаёте найденные куски в промпт, модель отвечает на их основе
Главная боль RAG, которую курс честно проговаривает, это качество чанкинга (разбиения на куски). Если разрезать документ неправильно, модель получит обрывки без контекста. Абзац без заголовка, ответ без вопроса, цена без названия услуги.
Практические советы из курса:
- Используйте перекрывающиеся куски (overlap), чтобы не терять контекст на границах
- Сохраняйте метаданные: источник, дату, раздел
- Просите модель цитировать источники, это снижает галлюцинации
Я применяю RAG для работы с базой знаний стоматологии. 6 лет накопленного контента: ответы на вопросы пациентов, информация об услугах, памятки после процедур. Вместо того чтобы загружать всё в контекст (невозможно физически), система находит релевантные фрагменты по запросу администратора.
MCP: универсальный стандарт для AI-интеграций
MCP (Model Context Protocol) Anthropic называют «USB-C для AI». Красивая метафора, и она точная. До USB-C каждое устройство требовало свой кабель. MCP создаёт единый стандарт для подключения AI-моделей к внешним системам.
Зачем это нужно? Раньше каждую интеграцию приходилось писать с нуля. Подключить Claude к Google Docs? Пишем код. К Notion? Новый код. К Slack? Ещё код. MCP позволяет создавать универсальные коннекторы, которые работают с любой MCP-совместимой моделью.
Архитектура MCP:
- MCP Server — предоставляет инструменты и ресурсы (например, сервер для Google Sheets)
- MCP Client — потребляет эти возможности (например, Claude Code)
- Protocol — стандарт обмена данными между ними
Курс подчёркивает: MCP — открытый стандарт. Anthropic опубликовали спецификацию, и сообщество создаёт коннекторы для всего: от GitHub до Figma, от Telegram до CRM-систем.
У меня сейчас подключено 4 MCP-коннектора: Google Sheets (контент-планы), файловая система (локальные документы), Chrome DevTools (тестирование сайтов), Notion (заметки). Это реально меняет рабочий процесс. Claude видит мои данные в реальном времени, а не работает с копиями, которые я вручную загружаю.
Workflows vs Agents: когда автоматизация, а когда автономность
Курс вводит важное различие между двумя подходами к AI-системам.
Workflows (рабочие процессы) — предопределённые цепочки действий. Шаг 1 → Шаг 2 → Шаг 3. Вы заранее знаете порядок, логику ветвлений, точки принятия решений. Workflow детерминирован: при одинаковых входных данных получаете предсказуемый результат.
Agents (агенты) — автономные системы, которые сами решают, что делать дальше. Агент получает цель, анализирует ситуацию, выбирает инструменты, выполняет действия, оценивает результат, корректирует курс. Агент адаптивен: может справиться с ситуацией, которую вы не предусмотрели.
| Аспект | Workflow | Agent |
|---|---|---|
| Контроль | Полный, вы определяете каждый шаг | Частичный, агент принимает решения |
| Предсказуемость | Высокая | Средняя |
| Гибкость | Низкая (только предусмотренные сценарии) | Высокая (адаптация на лету) |
| Сложность | Проще отлаживать | Сложнее предсказать поведение |
| Применение | Рутинные повторяющиеся задачи | Исследования, творческие задачи |
Когда что использовать?
Workflow — когда процесс понятен и повторяется. Обработка заявок, генерация отчётов, публикация контента по расписанию. Я использую workflow для ежедневной публикации постов: забрать из таблицы → проверить → сформировать → отправить в PostMyPost.
Agent — когда задача требует исследования или адаптации. Анализ конкурентов, поиск решения проблемы, создание нового продукта. Агент может пойти неожиданным путём и найти решение, которое вы бы не предусмотрели.
Anthropic предупреждают: агенты мощнее, но требуют больше контроля. Нужны чёткие границы, механизмы остановки, логирование действий. Автономность без надзора опасна.
Prompt Caching: экономия токенов на повторяющихся запросах
Практичная оптимизация, о которой многие не знают. Если вы отправляете Claude длинный системный промпт с каждым запросом (а вы отправляете, если работаете через API), вы платите за эти токены каждый раз.
Prompt Caching позволяет закэшировать статичную часть промпта. При следующих запросах эта часть не тарифицируется повторно. Экономия достигает 90% на длинных промптах.
Как это работает:
- Помечаете часть промпта как cacheable (кэшируемую)
- При первом запросе платите полную стоимость
- При последующих запросах кэшированная часть стоит значительно дешевле
Где применять? Везде, где есть длинный статичный контекст:
- Системные инструкции агента
- База знаний компании
- Примеры для few-shot learning
- Документация продукта
Мой пример: у агента для стоматологии системный промпт на 8 000 токенов (инструкции, примеры ответов, информация о клинике). За месяц агент обрабатывает 500 запросов. Без кэширования это 4 миллиона токенов только на промпт. С кэшированием, примерно 400 тысяч. Экономия ощутимая.
Extended Thinking: как заставить Claude думать глубже
Extended Thinking (расширенное мышление) заставляет модель «думать вслух» перед ответом. Вместо мгновенной генерации Claude проходит через этап рассуждений: анализирует задачу, рассматривает варианты, проверяет логику.
Зачем это нужно? Для сложных задач, где первый ответ часто ошибочен:
- Математические расчёты
- Логические головоломки
- Анализ с множеством переменных
- Код со сложной логикой
- Стратегические решения
Курс объясняет механику: Extended Thinking создаёт дополнительный «бюджет токенов» для размышлений. Эти токены не видны пользователю, но модель их генерирует и использует для улучшения финального ответа.
Практически это выглядит так: вы включаете Extended Thinking в настройках API и указываете бюджет (сколько токенов модель может потратить на размышления). Claude анализирует задачу, и если она сложная, использует этот бюджет. Если простая, отвечает сразу.
Когда включать Extended Thinking:
- Задачи с неочевидным решением
- Ситуации, где важна точность, а не скорость
- Анализ с множеством факторов
Когда не нужно:
- Простые операции (форматирование, извлечение данных)
- Задачи, где скорость критична
- Массовая обработка однотипных запросов
Я использую Extended Thinking для стратегических задач: планирование кампаний, анализ конкурентов, разбор сложных клиентских ситуаций. Для рутинной генерации контента оно избыточно.
Чему я научилась и что внедрила
После курса я пересмотрела архитектуру своих AI-систем. Вот что изменилось:
Выбор модели под задачу. Раньше использовала Opus для всего «чтобы точно сработало». Теперь Haiku классифицирует, Sonnet генерирует, Opus подключается для сложного. Экономия бюджета примерно 60%.
Осознанное управление контекстом. Понимание stateless-природы API изменило то, как я структурирую промпты. Меньше истории, больше релевантного контекста.
MCP-интеграции. Подключила Google Sheets и Notion напрямую. Claude видит актуальные данные, не нужно копировать вручную.
Tool use для автоматизаций. Настроила инструменты для типовых операций: публикация, проверка, обновление статусов. Агент выполняет действия, я контролирую результат.
Кому подойдёт этот курс?
Курс технический, но доступный. Код показывают, но понимать его необязательно. Главное, это концепции.
Подойдёт:
- Разработчикам, которые интегрируют AI в продукты
- Маркетологам и предпринимателям, которые строят AI-автоматизации
- Тем, кто прошёл Claude 101 и хочет глубже
- Руководителям, которые оценивают возможности AI для бизнеса
Не подойдёт:
- Тем, кто хочет просто пользоваться Claude в чате (достаточно Claude 101)
- Тем, кто ищет готовые решения без понимания механики
Курс на английском, язык технический, но понятный. 2 часа, можно пройти за один вечер. Сертификат бесплатный.
Серия «Учусь вместо вас»:
- Claude 101
- AI Fluency for Educators
- Claude Code in Action, часть 1
- Claude Code in Action, часть 2
- Agent Skills, часть 1
- Agent Skills, часть 2
- Building with the Claude API ← вы здесь
- Introduction to MCP
FAQ: вопросы о курсе
Нужно ли уметь программировать для прохождения курса?
Желательно понимать основы (что такое API, JSON, функции), но писать код не требуется. Курс объясняет концепции через диаграммы и примеры. Даже без опыта программирования вы поймёте, как работают AI-системы.
Чем этот курс отличается от Claude 101?
Claude 101 про использование Claude в веб-интерфейсе. Building with the Claude API про создание систем на базе Claude. Первый для пользователей, второй для создателей.
Можно ли применить знания без программиста?
Частично. Понимание моделей, RAG, tool use поможет грамотно ставить задачи разработчику. MCP-коннекторы можно подключить через Claude Code без написания кода. Но полноценная интеграция API требует разработки.
Есть ли практические задания?
Курс обзорный, без hands-on заданий. Но Anthropic предоставляют песочницу API, где можно экспериментировать после прохождения.
Сколько стоит использование Claude API?
Зависит от модели и объёма. Haiku стоит около $0.25 за миллион токенов, Opus около $15. Для экспериментов Anthropic даёт бесплатные кредиты. Для продакшн-использования нужен платный аккаунт.
Если вы хотите внедрить Claude в свои процессы и не знаете, с чего начать, запишитесь на консультацию. Разберём ваши задачи, подберём архитектуру и инструменты под ваш бюджет.
Читайте также
Хотите разобраться с AI?
60 минут, $100, конкретный план действий.