336 captures
10 Mar 2017 - 01 Jan 2026
Aug SEP Oct
23
2019 2020 2021
success
fail

About this capture

COLLECTED BY

Collection: GDELT Project

TIMESTAMPS

The Wayback Machine - http://web.archive.org/web/20200923070247/https://cloud.google.com/dataprep
 












Docs   Support  











Data analytics products  


Contact Sales   Get started for free
 














Why Google  

More  



Solutions  

More  



Products  

More  



Pricing  

More  



Getting started  

More  



Docs  

Support  

Console  

Contact Sales  

Get started for free  





Groundbreaking solutions. Transformative know-how.  

Learn more  

Why Google Cloud  

Choosing Google Cloud  

Trust and security  

Open cloud  

Global infrastructure  

Analyst reports  

Customer stories  

Partners  

Google Cloud Blog  

Events  



Industry Solutions  

Retail  

Financial Services  

Healthcare and Life Sciences  

Media and Entertainment  

Telecommunications  

Gaming  

Manufacturing  

Energy  

Government  

Education  

Small and Medium Business  

Cloud Natives  

See all solutions  

Application Modernization  

Hybrid and Multi-cloud Application Platform  

Cloud-Native App Development  

Serverless solutions  

DevOps  

Configuration Management  

Continuous Delivery (CD)  

Continuous Integration (CI)  

Infrastructure as Code  

Secrets Management  

Mainframe Modernization  

Hosting  

Artificial Intelligence  

Build and Use AI  

Contact Center AI  

Document AI  

Cloud Talent Solution  

Business Application Platform  

New Business Channels Using APIs  

Unlocking Legacy Applications Using APIs  

Open Banking APIx  

Data Management  

Database Migration  

Database Modernization  

Google Cloud Databases  

Migrate Oracle workloads to Google Cloud  

Open Source Databases  

SQL Server on Google Cloud  

Digital Transformation  

Business Continuity  

Digital Innovation  

Operational Efficiency  

COVID-19 Solutions  

COVID-19 Solutions for the Healthcare Industry  

Infrastructure Modernization  

VM Migration  

SAP on Google Cloud  

High Performance Computing  

Windows on Google Cloud  

Data Center Migration  

Marketing Technology  

Active Assist  

Virtual Desktops  

Productivity and Collaboration  

G Suite  

G Suite Essentials  

Cloud Identity  

Chrome Enterprise  

Cloud Search  

Security  

Application Security  

Security Analytics and Operations  

BeyondCorp Remote Access  

Smart Analytics  

Data Warehouse Modernization  

Stream Analytics  

Marketing Analytics  

Data Lake Modernization  

Business Intelligence  



Featured Products  

Compute Engine  

Cloud Storage  

Cloud SDK  

Cloud SQL  

Google Kubernetes Engine  

BigQuery  

Cloud CDN  

Dataflow  

Operations  

Cloud Run  

Cloud Functions  

See all products (100+)  

AI and Machine Learning  

Speech-to-Text  

Vision AI  

Text-to-Speech  

Cloud Translation  

Cloud Natural Language  

AutoML  

AI Platform  

Video AI  

AI Infrastructure  

Dialogflow  

AutoML Tables  

See all AI and machine learning products  

API Management  

Apigee API Platform  

Analyze APIs  

Monetize APIs  

Apigee Hybrid  

Apigee Sense  

Cloud Endpoints  

Developer Portal  

Apigee Healthcare APIx  

Apigee Open Banking APIx  

Cloud Healthcare API  

AppSheet  

Compute  

Compute Engine  

App Engine  

Cloud GPUs  

Migrate for Compute Engine  

Preemptible VMs  

Shielded VMs  

Sole-Tenant Nodes  

Bare Metal  

Recommender  

VMware Engine  

Cloud Run  

See all compute products  

Containers  

Google Kubernetes Engine  

Container Registry  

Container Security  

Cloud Build  

Deep Learning Containers  

Kubernetes Applications  

Artifact Registry  

Knative  

Cloud Run  

Cloud Code  

Data Analytics  

BigQuery  

Looker  

Dataflow  

Pub/Sub  

Dataproc  

Cloud Data Fusion  

Cloud Composer  

Data Catalog  

Dataprep  

Google Data Studio  

Google Marketing Platform  

Cloud Life Sciences  

Databases  

Cloud Bigtable  

Firestore  

Memorystore  

Cloud Spanner  

Cloud SQL  

Firebase Realtime Database  

Developer Tools  

Cloud SDK  

Container Registry  

Cloud Build  

Cloud Source Repositories  

Cloud Scheduler  

Tekton  

Cloud Tasks  

Cloud Code  

Tools for Visual Studio  

Tools for Eclipse  

Cloud Code for IntelliJ  

See all developer tools  

Healthcare and Life Sciences  

Apigee Healthcare APIx  

Cloud Healthcare API  

Cloud Life Sciences  

Hybrid and Multi-cloud  

Anthos  

Cloud Run for Anthos  

Google Cloud Marketplace for Anthos  

Migrate for Anthos  

Operations  

Cloud Build  

Traffic Director  

Apigee API Management  

Internet of Things  

Cloud IoT Core  

Edge TPU  

Management Tools  

Cloud Shell  

Cloud Console  

Cloud Deployment Manager  

Cloud Mobile App  

Cloud APIs  

Private Catalog  

Cost Management  

Media and Gaming  

Game Servers  

Zync Render  

Anvato  

OpenCue  

Migration  

BigQuery Data Transfer Service  

Cloud Data Transfer  

Cloud Foundation Toolkit  

Transfer Service  

Migrate for Anthos  

Migrate for Compute Engine  

Transfer Appliance  

VM Migration  

Networking  

Cloud Armor  

Cloud CDN  

Cloud DNS  

Cloud Load Balancing  

Cloud NAT  

Hybrid Connectivity  

Network Intelligence Center  

Network Service Tiers  

Network Telemetry  

Traffic Director  

Virtual Private Cloud  

Service Directory  

Operations  

Cloud Logging  

Cloud Monitoring  

Error Reporting  

Kubernetes Engine Monitoring  

Service Monitoring  

Cloud Trace  

Cloud Profiler  

Cloud Debugger  

Transparent Service Level Indicators  

Security and Identity  

Cloud IAM  

Assured Workloads  

Cloud Key Management  

Confidential Computing  

Security Command Center  

Cloud Data Loss Prevention  

Managed Service for Microsoft Active Directory  

Access Transparency  

Titan Security Key  

Secret Manager  

See all security and identity products  

Serverless Computing  

Cloud Run  

Cloud Functions  

App Engine  

Workflows  

Storage  

Cloud Storage  

Filestore  

Persistent Disk  

Cloud Storage for Firebase  

Local SSD  

Archival Storage  

Cloud Data Transfer  

G Suite Essentials  



Do more for less with Google Cloud  

Contact sales  

Google Cloud Platform  

Overview  

Price list  

Calculators  

Free on Google Cloud  

More Cloud Products  

G Suite  

Google Maps Platform  

Cloud Identity  

Apigee  

Firebase  

Zync Render  



Get started with Google Cloud  

Try GCP Free  

Get Started  

Resources to Start on Your Own  

Quickstarts  

GCP Marketplace  

Training  

Certification  

Get Help from an Expert  

Consulting  

Technical Account Management  

Find a Partner  

Become a Partner  

More ways to get started  






Home  


Products  


Data analytics products  


Cloud Dataprep by Trifacta  




 



Dataprep by Trifacta 


An intelligent cloud data service to  visually explore, clean, and prepare data for analysis and machine  learning.

Try it free   Contact sales  


View documentation  for this product. 






Intelligent data preparation

Intelligent data preparation


Cloud Dataprep by Trifacta is an intelligent  data service for visually exploring, cleaning, and preparing  structured and unstructured data for analysis, reporting, and  machine learning. Because Cloud Dataprep is serverless and works  at any scale, there is no infrastructure to deploy or manage. Your  next ideal data transformation is suggested and predicted with  each UI input, so you dont have to write code.
 



What's new

 








Blog  post

New AI-driven features in  Dataprep enhance the wrangling experience
 

Read blog post    





Blog  post

Mastering Pricing Optimization  with Data Preparation
 

Read blog post    





Webinar

Automate Self-Service Data  Warehousing for Any Size Business
 

Read report    





















Serverless simplicity

 
Cloud Dataprep is an integrated partner service operated by  Trifacta  and based on their industry-leading data preparation solution.  Google works closely with Trifacta to provide a seamless user  experience that removes the need for up-front software  installation, separate licensing costs, or ongoing operational  overhead. Cloud Dataprep is fully managed and scales on demand  to meet your growing data preparation needs so you can stay  focused on analysis.
 





Fast exploration and anomaly detection  


Understand and explore data instantly with visual data  distributions. Cloud Dataprep automatically detects schemas,  data types, possible joins, and anomalies such as missing  values, outliers, and duplicates so you get to skip the  time-consuming work of assessing your data quality and go right  to the exploration and analysis.
 





Easy and powerful data preparation

 
With each gesture in the UI, Cloud Dataprep automatically  suggests and predicts your next ideal data transformation. Once  youve defined your sequence of transformations, Cloud Dataprep  uses Cloud Dataflow under the hood, enabling you to process  structured or unstructured datasets of any size with the ease of  clicks, not code.
 




Features

 




Predictive transformation

 
Cloud Dataprep uses a proprietary inference algorithm to  interpret the data transformation intent of a users data  selection. A ranked set of suggestions and patterns for the  selections to match are automatically generated.
 

Rich transformations

 
Leverage hundreds of transformation functions to turn your  data into the asset you want. With a click of a mouse, apply  aggregation, pivot, unpivot, joins, union, extraction,  calculation, comparison, condition, merge, regular  expressions, and more.
 

Parameterization

 
Execute a recipe across multiple instances of identical  datasets by parameterizing a variable to replace the parts of  the file path that change with each refresh. This variable can  be modified as needed at job runtime.
 

Collaboration

 
In team environments, it can be helpful to be able to have  multiple users work on the same assets or to create copies of  good quality work to serve as templates for others. Cloud  Dataprep enables users to collaborate on the same flow objects  in real time or to create copies for others to use for  independent work.
 

Pattern matching

 
Utilize columnar pattern matching to identify data patterns  of interest to you and to surface them in the interface for  use in building your recipes. Additionally, in your recipe  steps, you can apply regular expressions or Cloud Dataprep  patterns to locate patterns and transform the matching data in  your datasets.
 

Standardization

 
Group values by similarities based on spelling or  language-independent pronunciation and create standardized  clusters of consistent values.
 

Active profiling

 
See and explore your data through interactive visual  distributions of your data to assist in discovery, cleansing,  and transformation. Visual representations help interpret  large volumes of data, and Cloud Datapreps innovative  profiling techniques visualize key statistical information in  a dynamic, easy-to-consume format.
 

Sampling

 
For performance optimization, Cloud Dataprep automatically  generates one or more samples of the data for display and  manipulation in the client application. However, you can  easily change the size of samples, the scope of the sample,  and the method by which the sample is created.
 

Scheduling

 
Schedule the execution of recipes in your flows on a  recurring or as-needed basis. When the scheduled job  successfully executes, you can collect the wrangled output in  the specified output location, where it is available in the  published form you specify.
 

Rapid targeting

 
Define target schemas, through imported or created datasets,  and assign to an existing recipe to systematize and speed up  your wrangling efforts. Targets appear in the Transformer page  and can be applied against the entire dataset or selected  columns of the dataset you need to wrangle.
 

Common data types

 
Transform structured or unstructured datasets, stored in CSV,  JSON, or relational table formats, of any size  megabytes to  petabytes  with equal ease and simplicity.
 

Integrated with Google Cloud Platform  


Process data stored in Cloud Storage, BigQuery, or from your  desktop, then export refined data to BigQuery or Cloud Storage  for storage, analysis, visualization, or machine learning.  User access and data security is seamlessly managed with Cloud  Identity and Access Management.
 






Cloud Dataprep architecture 





Cloud Dataprep Architecture








Cloud Dataprep allows  us to quickly explore new datasets and its flexibility supports all  our data transformation needs. Data preparation work at Merkle is  now completed in minutes, not hours or days, accelerating our data  preparation time by 90%. 
Henry  Culver, IT Architect, Merkle 


Asset description.

Read story    




Our customers

 


Craveable BrandsTravis PerkinsUnacastChopeAlpha VertexFoundation For Precision Medicine


Resources  







View quickstart
Get started with  the Cloud Dataprep Quickstart
 

View quickstart    




View documentation
Cloud Dataprep  product announcements and updates
 

View documentation    




Learn more
Engage with other  Cloud Dataprep users on Stack Overflow
 

Learn more    




Learn more
Dataprep by  Trifacta FAQs

Learn  how Trifacta complies with security, privacy and data  protection 
 

Learn more    




Read blog post
Automate Cloud  Dataprep Pipelines On File Arrival with Cloud Functions
 

Read blog post    




View tutorial
Working with the  Cloud Dataprep self-paced lab
 

View tutorial    




Learn more
ML Automation with  BigQuery ML, Cloud Dataprep, and Cloud Composer 


Learn more    




Learn more
Build a Marketing  Data Warehouse
 

Learn more    




View tutorial
How to stream IoT  Core data to Cloud Dataprep
 

View tutorial    






Pricing

 


Cloud Dataprep is an interactive web application in which users  define the data preparation rules by interacting with a sample  of their data. For execution of the flow over the complete  dataset, the flow can be executed as a Cloud Dataprep job (using  Google Cloud Dataflow). Learn more and view complete details in  our  pricing guide.  






Take the next step

 


Start building on Google Cloud  with $300 in free credits and 20+ always free products.
 

Try it free  





Need help getting  started? 
Contact sales  


Work with a  trusted partner 
Find a partner  


Continue browsing  
See all products  








Choosing Google Cloud  

Trust and security  

Open cloud  

Global infrastructure  

Customers and case studies  

Analyst reports  

Whitepapers  





GCP pricing  

G Suite pricing  

Maps Platform pricing  

See all products  





Infrastructure modernization  

Data management  

Application modernization  

Smart analytics  

Artificial Intelligence  

Security  

Productivity & work transformation  

Industry solutions  

DevOps solutions  

Small business solutions  

See all solutions  





GCP documentation  

GCP quickstarts  

Google Cloud Marketplace  

G Suite Marketplace  

Support  

Tutorials  

Training  

Certifications  

Google Developers  

Google Cloud for Startups  

System status  

Release Notes  





Contact sales  

Find a Partner  

Become a Partner  

Blog  

Events  

Podcast  

Community  

Press center  

Google Cloud on YouTube  

GCP on YouTube  

G Suite on YouTube  

Follow on Twitter  

Join User Research  

We're hiring. Join Google Cloud!  






About Google  

Privacy  

Site terms  

Google Cloud terms  

Sign up for the Google Cloud newsletter   Subscribe