Каждые полтора года компания SAS проводит форум, на котором обсуждается множество вопросов - аналитика, программирование, технологии, инфраструктурные решения. К форуму множество компаний выпускается серия статей на различные темы в виде так называемый "white list". Перевод некоторых интересных статей по теме программирования, выполненный студентами прошлых лет, приводится на данной странице.
Диаграмма Санкей - это особый тип диаграммы потока, в которой ширина стрелок показана пропорционально параметру потока. Диаграмма Санкей делает визуальный акцент на основных перемещениях или потоках внутри системы. Они помогают определить основной вклад в общий поток. В этой статье основное внимание будет уделено очереди лекарств, ожидающих выхода на рынок в которые вложился спонсор и использованию данных из clinicaltrials.gov для анализа количества клинических испытаний, проведенных спонсором, с точки зрения условий, воздействий и фаз. Это будет визуализировано с помощью диаграммы Санкей и отображение веса, который спонсор дал лекарству или состоянию, основанному на фазах клинических испытаний. Очередь лекарств, ожидающих выхода на рынок дает нам представление о будущем компании, и эта статья даст глубокое погружение в некоторые аспекты с помощью диаграмм Санкей.
В настоящее время, многие из нас используют инструменты повышения производительности на облачной архитектуре. Некоторые из нас также используют программное обеспечение SAS® в облаке. Для тех из нас, кто использует SAS для чтения и создания документов Microsoft Excel, облачные файлы могут доставить неудобства при автоматизации процесса. Но они также открывают и ряд захватывающих возможностей!
Пакет Microsoft Office 365 предлагает API для поиска, извлечения и обновления наших документов с помощью кода. В этой статье я покажу вам, как использовать программы SAS для доступа к вашему Microsoft OneDrive и облаку SharePoint для чтения и обновления файлов. Также я покажу вам, как использовать функции совместной работы Microsoft Teams для публикации полезных новостей (обновлений) для себя и ваших коллег. Этот подход опирается на API REST в Microsoft Office 365 и на процедуру HTTP в SAS.
В большинстве крупных организаций SAS играет ключевую роль в обработке данных для хранения, отчетности, аналитики и многого другого Язык SAS предоставляет множество инструментов и опций для оптимизации потребностей в обработке данных, которые могут быть незнакомы многим разработчикам. В этой статье будут представлены некоторые известные и не очень известные методы SAS для эффективной обработки данных. Основное внимание в статье уделяется существующим методам и сценариям использования для каждого из них, а не подробным практическим рекомендациям по конкретному решению.
Когда вам нужно выполнить проект по строительству дома или ремонту, вам понадобятся профессиональные инструменты для работы. То же самое верно, когда вы хотите построить (создать) или изменить (обновить) таблицу в Microsoft Excel. Для выполнения этих задач вам понадобится множество экспертных инструментов в вашем программном наборе SAS. У вас есть выбор из множества инструментов, которые позволяют создавать и полностью настраивать ваши рабочие листы. Например, вы можете использовать место назначения Excel для SAS Output Delivery System (ODS) и процедуру SAS export. Но вы также можете дополнить стандартные инструменты более специализированными (например, макросами SAS и языком с открытым исходным кодом Python), чтобы еще больше расширить возможности ваших рабочих листов.
В этом документе объясняется, как использовать все эти инструменты для создания полнофункциональных рабочих листов Microsoft Excel.
Двойной цикл DOW-loop вместе с PROC REPORT может использоваться для представления информации порядка переменных между страницами, когда вертикальное пространство необходимо для разделения блоков связанных рядами. При создании отчетов назначением PDF ODS, опция SPANROWS используется для повторения значений параметров GROUP или ORDER между страницами. Однако иногда значения не повторяются, как ожидалось, в частности, когда используются операторы BREAK или LINE.
В статье будет предложено решение. А также - будет приведен пример, демонстрирующий проблему и использующий предлагаемое решение с использованием Base SAS ® 9.4 в среде Windows. Он подходит для программистов в любой отрасли с базовым пониманием PROC REPORT.
The SAS® Data Connect Accelerator for Hadoop использует встроенный процесс SAS для повышения производительности при перемещении данных между Apache™ Hadoop® источниками и SAS® Cloud Analytic Services. Достижение оптимальной производительности при перемещении данных может оказаться сложной задачей. Некоторые из переменных, которые следует учитывать, включают размер кластера, количество доступных ядер, размер данных и количество разделений в файле. В этом документе объясняется, как оптимизировать встроенный процесс SAS и как воспользоваться преимуществами нового режима непрерывной обработки Apache™ Spark™, доступного во встроенном процессе SAS.
Правила области видимости макропеременных языка макросов SAS® сложны и хорошо документированы. Функция DOSUBL, представленная в SAS 9.3M2, добавляет дополнительный уровень сложности к этим правилам области видимости, поскольку программисту макросов необходимо понимать, как код, выполняемый в побочном сеансе DOSUBL, будет создавать или обновлять макропеременные и какое влияние это окажет для макропеременных, хранящихся в основных таблицах символов сеанса. К сожалению, текущая документация SAS не дает четкого определения правил определения области видимости макропеременных DOSUBL. В этой статье представлен ряд тестовых примеров, призванных проиллюстрировать как DOSUBL обрабатывает области видимости макропеременных и определяет набор правил области видимости макропеременных DOSUBL. Целевая аудитория - опытные программисты SAS Macro, заинтересованные в изучении того, как DOSUBL управляет областями видимости макропеременных.
В рамках обследований культуры безопасности пациентов (SOPS ™) Агентства по исследованиям и качеству здравоохранения (AHRQ) каждые два года оцениваются мнения сотрудников об их организационной культуре в отношении безопасности пациентов. В BJC результаты опроса суммируются для 15+ организаций-поставщиков на многих уровнях иерархии человеческих ресурсов (Human resources – HR) и передаются руководству по всей системе. Следовательно, отчеты требуют сложного форматирования, отладки и проверки данных. В течение 2016 года около 500 отчетов в формате PDF пришлось подготавливать вручную, что повлекло за собой множество ошибок и было времязатратным. В 2018 году, основываясь на уроках, извлеченных из 2016 года, наша команда создала программы SAS Enterprise Guide® для автоматического создания 855 отчетов в формате PDF. В этом документе представлены методы, используемые для процесса создания отчетов, включая макросы ODS PDF, ODS LAYOUT, PROC REPORT, цикл DO и многое другое. Кроме того, будут обобщены методы форматирования ODS, которые обсуждались в существующих публикациях. Основное внимание будет уделено стратегиям разработки структуры программы, созданию шаблонов PDF и созданию макросов. Подробно обсуждаются методы, повышающие эффективность, такие как цикл DO и автоматический процесс проверки вывода PDF. Благодаря усовершенствованному и автоматизированному процессу подготовки отчетов, используемому в 2018 году, ресурсы, затраченные на этот проект, были значительно сокращены по сравнению с 2016 годом.
Язык SAS/IML® превосходно справляется с обработкой матриц и выполнением матричных вычислений. Новые возможности в SAS/IML версии 14.2 поддерживают нематричные структуры данных, такие как таблицы и списки.
В матрице все элементы одного типа: числового либо символьного. Кроме того, все строки имеют одинаковую длину. Напротив, SAS/IML 14.2 позволяет вам создать структуру, содержащую множество объектов различных типов и размеров. Например, вы можете создать массив матриц, в котором каждая матрица будет иметь разное измерение. Вы можете создать таблицу, которая будет являться версией набора данных в памяти. Вы можете создать список, который содержит матрицы, таблицы и другие списки.
В этой статье описаны новые структуры данных и показано как вы можете использовать их для имитации других структур, таких как стеки, ассоциативные массивы и деревья. В ней так же представлены примеры того, как вы можете использовать коллекции объектов в качестве структур данных в статистических алгоритмах.
Теги необходимы для PDF файлов, чтобы соответствовать стандартам доступности, которые содержатся в «Раздел 508 в отношении доступности web-контента (WCAG)». В четвертом выпускном релизе SAS 9.4 опция для выражений ODS, ACCESSIBLE (доступность), позволяет создавать тегированные PDF файлы. Мы рассмотрим, как эта опция изменяет создаваемый файл и сосредоточимся на методах программировании SAS®, взаимодействующих с ним. После этого у вас будет возможность попробовать эту опцию в вашем коде и отправить отзывы в SAS.
SAS® Scalable Performance Data Server и SAS® Scalable Performance Engine – это форматы данных SAS, которые поддерживают создание аналитических базовых таблиц с десятками тысяч колонок. Эти используются для поддержания ежедневных аналитических операций по прогнозированию. По традиции, Storage Area Network (сеть области хранения, SAN) была и продолжает быть первичной платформой хранения в SAS® Scalable Performance Data Server и SAS® Scalable Performance Engine. В связи со стоимостью ограничений, связанных с хранением SAN, компании добавили программное средство Hadoop к их среде разработки для минимизации стоимости хранения. В данном документе мы исследуем, как SAS® Scalable Performance Data Server и SAS® Scalable Performance Engine используют Hadoop Distributed File System (HDFS).
Хеш-объект SAS ® — это невероятно мощный метод интеграции данных из двух или более наборов данных на основе общего ключа. В настоящей работе описана базовая методология определения, заполнения и использования хэш-объекта для выполнения поиска в рамках шага ДАННЫХ и приведены примеры ситуаций, в которых производительность программ SAS улучшается за счет их использования. Объясняются общие проблемы, возникающие при использовании хэш-объектов, а также демонстрируются инструменты и методы оптимизации хэш-объектов в вашей программе SAS.
Обработка исключений описывает как идентификацию и реакцию на неблагоприятные, неожиданные или несвоевременные события, которые могут привести к сбою процесса или программы, так и на ожидаемые события или внешние события, которые должны динамически обрабатываться по заранее заданным каналам. Быстрое подавление ошибок и автоматическое возвращение к функционированию – это хорошо, но когда происходят катастрофические события, процедуры обработки исключений должны уметь изящно завершить процесс и предоставить разработчикам важные показатели выполнения, необходимые как для исправления ошибок, так и для совершенствования модели. Эта статья вводит пользователей в область базовых процедур обработки исключений в SAS Base, которые облегчают разработку надёжного ПО.
Процедура MEANS / SUMMARY - рабочая лошадка для большинства аналитиков данных. Она используется для создания таблиц сводной статистики, а также сложных сводных наборов данных. У пользователя есть множество опций, которые можно использовать для настройки того, что должна производить процедура. К сожалению, большинство аналитиков полагаются только на несколько простых базовых способов настройки шага PROC, никогда не осознавая, что существует ряд менее часто используемых опций и операторов, которые могут значительно упростить код процедуры, шаги анализа и конечный результат.
В этом руководстве представлен ряд важных и полезных опций и утверждений, которые могут предоставить аналитику столь необходимые инструменты. Некоторые из этих инструментов являются новыми, у других есть применение, выходящее за рамки MEANS / SUMMARY, все они имеют практическую полезность. Обладая этими практическими знаниями, Вы можете значительно повысить удобство использования процедуры, и тогда вы тоже будете делать больше с помощью MEANS / SUMMARY.
Новое с SAS® 9.2, ODS Graphics представляет совершенно новый способ создания высококачественных графиков с помощью SAS. С помощью всего лишь нескольких строк кода можно добавить сложные графики к выводу существующих статистических процедур или создать автономные графики. SGPLOT процедура создает различные графики включая гистограммы, точечные диаграммы, и линейные графики. Поскольку ODS Graphics использует the Output Delivery System, графики могут быть отправлены в назначения и использовать стили ODS. В этой статье рассказывается, как создавать различные типы графиков используя PROC SGPLOT, как отправить график в различные назначения ODS, и как применить стили ODS к вашему графику. Мы также покажем, как использовать редактор ODS Graphics для внесения изменений, в графики созданные с помощью ODS Graphics.
Этот практический семинар научит вас реализовывать приложения SAS для параллельного выполнения кода и тем самым значительно сокращать общее время выполнения программы. Эта недоиспользованная технология SAS, версии 8, позволяет вашим заданиям SAS использовать преимущества нескольких процессоров на одной машине для параллельной обработки. Такая возможность, называемая MP CONNECT, позволяет параллельно выполнять непересекающиеся единицы работы и координировать все результаты в исходном сеансе SAS с целью сокращения общего времени, необходимого для выполнения конкретного приложения.
Программное обеспечение SAS® предоставляет сотни способов анализа ваших данных. Вы можете использовать шаг данных, чтобы сделать срез ваших данных, или ещё десятки процедур, которые будут обрабатывать ваши данные и формировать все виды статистики. Но есть вероятность, что независимо от того, как вы организуете и проанализируете свои данные, вы в конечном итоге создадите отчет в виде таблицы.
Вот почему каждый пользователь SAS должен знать, как использовать PROC TABULATE. Хотя TABULATE не делает ничего такого, что вы не можете сделать с другими процедурами, выигрыш заключается в выводе. TABULATE вычисляет различные статистические данные, и аккуратно оформляет результаты в виде одной таблицы.
К сожалению, TABULATE получил плохую репутацию как сложная процедура для изучения. Эта статья докажет, что если вы будете делать все шаг за шагом, то любой может научиться использовать PROC TABULATE.